在beautiful soup中搜索文本时如何从<a>获取href

2024-06-26 14:08:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在与selenium和BeautifulSoup以及selenium合作执行数据提取

本页已分页。我知道这个链接在页面的某个地方:

<a href="/DP/changeQueryPageAction.do?pager.offset=20">[ Next &gt; ]</a>

这个url在页面上是随机的,所以我需要做的是找到文本并提取href

如何让bs4找到文本并给出href

谢谢


Tags: 数据文本gt链接selenium地方页面do
1条回答
网友
1楼 · 发布于 2024-06-26 14:08:06

要基于文本或任何其他属性查找元素,必须使用re模块来获取该元素

import bs4
import re
html_doc="""<html><a href="/DP/changeQueryPageAction.do?pager.offset=20">[ Next &gt; ]</html></a>"""
soup = bs4.BeautifulSoup(html_doc, 'html.parser')
Search_Text=soup.find('a' , text=re.compile("Next"))
print(Search_Text['href'])

输出:

/DP/changeQueryPageAction.do?pager.offset=20

请让我知道它是否适合你

相关问题 更多 >