我想知道课间的头条新闻。标题围绕着h2标签。标题在标签后面
from bs4 import BeautifulSoup
import requests
r = requests.get("https://www.dailypost.ng/hot-news")
soup = BeautifulSoup(r.content, "html.parser")
mydivs = soup.findAll("span", {"class": "mvp-cd-date left relative"})
mytags = mydivs.findNext('h2')
for tag in mytags:
print(tag.text.strip())
soup.findAll()
返回一个列表(或None
),因此不能对其调用findNext()
。但是,您可以迭代标记并分别调用每个标记上的find_next()
:印刷品:
编辑:此脚本将从多个页面中删除标题:
必须遍历
mydivs
才能使用findNext()mydivs
是web元素的列表findNext
只适用于单个web元素。必须遍历div并对每个div运行findNext
加上这行就行了
把它放在
以下是您的工作程序的完整代码:
尝试将最后3行替换为:
相关问题 更多 >
编程相关推荐