BeautifulSoup4按文本正则表达式搜索标记

1条回答

网友

1楼 · 发布于 2024-09-29 17:18:19

Fir搜索元素您可以使用lambda和tag.text：

from bs4 import BeautifulSoup
import re

data = """
<B><A NAME="toc96446_13"></A>TEXT</B></P>
"""
soup = BeautifulSoup(data, 'html5lib')
print(soup.find(lambda t: t.name=='b' and re.search(r'TEXT', t.text)))

印刷品：

<b><a name="toc96446_13"></a>TEXT</b>

对于仅数字，您可以利用regexp{}和$常量（注意，这将只匹配第一个<p>标记和169内部，而不是第二个ab1234内部）：

soup = BeautifulSoup("<p>169</p><p>ab1234</p>", 'html5lib')
print(soup.find('p', text=re.compile(r'^\d+$')))

印刷品：

<p>169</p>

编程相关推荐

使用java在mysql中使用外键插入到表中
java Android按类别筛选列表
java对JGoodies外观的更改
java如何在Drools规则中推断中间值
用于虚拟拆分文本文件的java解决方案
使用XML的java Android UI（Android和XML）
使用ApachePOI库将工作表适配到xlsx文件中的单个页面时遇到的java问题
java类型为javafx。fxml。FXMLLoader不可访问（vscode）
java所有计划的作业都在运行，即使提到了节点id
java将大整数打印到文本文件

相关问题更多 >

编程相关推荐

热门问题

热门文章

BeautifulSoup4按文本正则表达式搜索标记

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >