2024-06-26 14:08:06 发布
网友
我正在与selenium和BeautifulSoup以及selenium合作执行数据提取
本页已分页。我知道这个链接在页面的某个地方:
<a href="/DP/changeQueryPageAction.do?pager.offset=20">[ Next > ]</a>
这个url在页面上是随机的,所以我需要做的是找到文本并提取href
如何让bs4找到文本并给出href
谢谢
要基于文本或任何其他属性查找元素,必须使用re模块来获取该元素
re
import bs4 import re html_doc="""<html><a href="/DP/changeQueryPageAction.do?pager.offset=20">[ Next > ]</html></a>""" soup = bs4.BeautifulSoup(html_doc, 'html.parser') Search_Text=soup.find('a' , text=re.compile("Next")) print(Search_Text['href'])
输出:
/DP/changeQueryPageAction.do?pager.offset=20
请让我知道它是否适合你
要基于文本或任何其他属性查找元素,必须使用
re
模块来获取该元素输出:
请让我知道它是否适合你
相关问题 更多 >
编程相关推荐