在beautiful soup中搜索文本时如何从<a>获取href - 问答 - Python中文网

在beautiful soup中搜索文本时如何从<a>获取href

2024-06-26 14:08:06 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我正在与selenium和BeautifulSoup以及selenium合作执行数据提取

本页已分页。我知道这个链接在页面的某个地方：

<a href="/DP/changeQueryPageAction.do?pager.offset=20">[ Next &gt; ]</a>

这个url在页面上是随机的，所以我需要做的是找到文本并提取href

如何让bs4找到文本并给出href

谢谢

Tags：数据文本 gt 链接 selenium 地方页面 do

1条回答

网友

1楼 · 发布于 2024-06-26 14:08:06

要基于文本或任何其他属性查找元素，必须使用re模块来获取该元素

import bs4
import re
html_doc="""<html><a href="/DP/changeQueryPageAction.do?pager.offset=20">[ Next &gt; ]</html></a>"""
soup = bs4.BeautifulSoup(html_doc, 'html.parser')
Search_Text=soup.find('a' , text=re.compile("Next"))
print(Search_Text['href'])

输出：

/DP/changeQueryPageAction.do?pager.offset=20

请让我知道它是否适合你

相关问题更多 >

编程相关推荐

热门问题

热门文章