使用beauthoulsoup通过文本获取Href

3条回答

网友

1楼 · 编辑于 2024-10-03 02:40:54

以及一个没有正则表达式的解决方案：

path = soup.select('a')
if path[0].getText().strip() == 'Something3':
print(path)

输出：

^{pr2}$

网友

2楼 · 编辑于 2024-10-03 02:40:54

您可以将:contains伪类与bs4 4.7.1一起使用

from bs4 import BeautifulSoup as bs

html = '<a href="page1/somethingC.aspx">Something3</a>'
soup = bs(html, 'lxml')
links = [link.text for link in soup.select('a:contains(Something3)')]
print(links)

网友

3楼 · 编辑于 2024-10-03 02:40:54

可以使用regex查找包含“Something3”的任何文本：

html = '''<a href="page1/somethingC.aspx">Something3</a>

<a href="page1/somethingC.aspx">
Something3</a>'''


from bs4 import BeautifulSoup
import re

soup = BeautifulSoup(html, "lxml")

path = soup.findAll('a', href=True, text=re.compile("Something3"))

for link in path:
    print (link['href'])

编程相关推荐

在glassfish3服务器上上载应用程序文件（ords.war）时发生java部署错误
java如何更改Elasticsearch上的别名值？
java如何使用Xpath读取更多XSD模式？
java使用jstl在两个jsp之间访问值
java将控制台输出转换为PDF文件
java在循环后没有得到任何结果，几乎完成
java运行的程序无法适应变化
java 安卓 RecyclerView添加新项目将回收移至列表顶部
将字符串转换为日期时的java偏移量
导入包的java问题

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用beauthoulsoup通过文本获取Href

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >