对于使用beautifulsoup和python进行web抓取,我是一个初学者。在yt视频的帮助下,我成功地接近了我的目标,即从汽车销售方的许多汽车列表中提取汽车名称。但是,我已经到了最后一步,不知道如何访问汽车名称:
这是我的代码(我只是按照youtube的例子):
page_soup = soup(page_html, "html.parser")
containers = page_soup.findAll("div",{"class":"ads__unit__content"})
contain = containers[0]
container = containers[0]
当我可爱的时候: 容器h2.a
我获得:
梅赛德斯-奔驰E-klasse全地形E220d 4M全地形
如何完成刚刚获得“梅赛德斯-奔驰E-klasse全地形E220d 4M全地形”汽车名称的最后一步
例如,如果我这样做的话
container.h2.a["id"]
我获得“16352571”。但是汽车名称前面没有id=之类的内容
我希望你能理解我的问题。我对Python非常陌生,对它了解不多
致意
如果您知道标签的确切位置,请尝试以下操作。希望它能帮助你
要访问元素的文本,可以使用
.text
属性。这将返回该特定节点内的所有文本节点要访问特定子对象的文本,可以按如下方式对其编制索引:
这将返回具有类
ads__unit__content__keys
的div的第三个子级中的文本另外,欢迎来到SO:D
相关问题 更多 >
编程相关推荐