使用python访问webscraping中的标题 - 问答 - Python中文网

使用python访问webscraping中的标题

2024-10-01 13:24:01 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

对于使用beautifulsoup和python进行web抓取，我是一个初学者。在yt视频的帮助下，我成功地接近了我的目标，即从汽车销售方的许多汽车列表中提取汽车名称。但是，我已经到了最后一步，不知道如何访问汽车名称：

这是我的代码（我只是按照youtube的例子）：

page_soup = soup(page_html, "html.parser")
containers = page_soup.findAll("div",{"class":"ads__unit__content"})
contain = containers[0]
container = containers[0]

当我可爱的时候：容器h2.a

我获得：

梅赛德斯-奔驰E-klasse全地形E220d 4M全地形

如何完成刚刚获得“梅赛德斯-奔驰E-klasse全地形E220d 4M全地形”汽车名称的最后一步

例如，如果我这样做的话

container.h2.a["id"]

我获得“16352571”。但是汽车名称前面没有id=之类的内容

我希望你能理解我的问题。我对Python非常陌生，对它了解不多

致意

Tags：名称 web id container html page h2 汽车

2条回答

网友

1楼 · 编辑于 2024-10-01 13:24:01

如果您知道标签的确切位置，请尝试以下操作。希望它能帮助你

container.h2.text

网友

2楼 · 编辑于 2024-10-01 13:24:01

要访问元素的文本，可以使用.text属性。这将返回该特定节点内的所有文本节点

要访问特定子对象的文本，可以按如下方式对其编制索引：

soup.find('div', {'class': 'ads__unit__content__keys'}).findAll('div')[2]

这将返回具有类ads__unit__content__keys的div的第三个子级中的文本

另外，欢迎来到SO:D

相关问题更多 >

编程相关推荐

热门问题

热门文章