使用python访问webscraping中的标题

2024-10-01 13:24:01 发布

您现在位置:Python中文网/ 问答频道 /正文

对于使用beautifulsoup和python进行web抓取,我是一个初学者。在yt视频的帮助下,我成功地接近了我的目标,即从汽车销售方的许多汽车列表中提取汽车名称。但是,我已经到了最后一步,不知道如何访问汽车名称:

这是我的代码(我只是按照youtube的例子):

page_soup = soup(page_html, "html.parser")
containers = page_soup.findAll("div",{"class":"ads__unit__content"})
contain = containers[0]
container = containers[0]

当我可爱的时候: 容器h2.a

我获得:

梅赛德斯-奔驰E-klasse全地形E220d 4M全地形

如何完成刚刚获得“梅赛德斯-奔驰E-klasse全地形E220d 4M全地形”汽车名称的最后一步

例如,如果我这样做的话

container.h2.a["id"]

我获得“16352571”。但是汽车名称前面没有id=之类的内容

我希望你能理解我的问题。我对Python非常陌生,对它了解不多

致意


Tags: 名称webidcontainerhtmlpageh2汽车
2条回答

如果您知道标签的确切位置,请尝试以下操作。希望它能帮助你

container.h2.text

要访问元素的文本,可以使用.text属性。这将返回该特定节点内的所有文本节点

要访问特定子对象的文本,可以按如下方式对其编制索引:

soup.find('div', {'class': 'ads__unit__content__keys'}).findAll('div')[2]

这将返回具有类ads__unit__content__keys的div的第三个子级中的文本

另外,欢迎来到SO:D

相关问题 更多 >