我是Python新手,目前正在尝试构建一个webscraper来学习Python语言。我想保存https://www.notebooksbilliger.de/studentenprogramm/notebooks中的所有列表,这是属于此网站学生优惠类别的所有笔记本
from urllib.request import urlopen
from bs4 import BeautifulSoup as soup
my_url = 'https://www.notebooksbilliger.de/studentenprogramm/notebooks'
uClient = urlopen(my_url)
page_html = uClient.read()
uClient.close()
page_soup = soup(page_html, "html.parser")
containers = page_soup.findAll("div", {"class":"mouseover clearfix"})
我也在控制台中尝试,但是当我检查容器的长度时,我得到的输出是:
>>> len(containers)
1
这是不对的,因为每页的列表设置为50。 我尝试过用不同的参数搜索,但我总是只找到一个项目,然后搜索停止
我现在有点迷路,想不出怎么解决这个问题。有什么帮助吗
问候:)
好吧,这太尴尬了
就在我发布它之后(在我多次搜索和无休止的尝试之后),我意识到html类不能包含空格,mouseover clearfix实际上是2个类。 这样做有效:
相关问题 更多 >
编程相关推荐