用Python创建网站时,BeautifulSoup findAll()找不到

2024-10-03 02:40:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我是Python新手,目前正在尝试构建一个webscraper来学习Python语言。我想保存https://www.notebooksbilliger.de/studentenprogramm/notebooks中的所有列表,这是属于此网站学生优惠类别的所有笔记本

from urllib.request import urlopen
from bs4 import BeautifulSoup as soup

my_url = 'https://www.notebooksbilliger.de/studentenprogramm/notebooks'

uClient = urlopen(my_url)
page_html = uClient.read()
uClient.close()

page_soup = soup(page_html, "html.parser")
containers = page_soup.findAll("div", {"class":"mouseover clearfix"})

我也在控制台中尝试,但是当我检查容器的长度时,我得到的输出是:

>>> len(containers)
1

这是不对的,因为每页的列表设置为50。 我尝试过用不同的参数搜索,但我总是只找到一个项目,然后搜索停止

我现在有点迷路,想不出怎么解决这个问题。有什么帮助吗

问候:)


Tags: fromhttpsimport列表myhtmlwwwpage
1条回答
网友
1楼 · 发布于 2024-10-03 02:40:41

好吧,这太尴尬了

就在我发布它之后(在我多次搜索和无休止的尝试之后),我意识到html类不能包含空格,mouseover clearfix实际上是2个类。 这样做有效:

containers = page_soup.findAll("div", {"class":"mouseover"})

相关问题 更多 >