简单xml字符串的简单正则表达式

2条回答

网友

1楼 · 编辑于 2024-06-26 00:28:17

使用解析器，例如^{}：

import re
from bs4 import BeautifulSoup

s = '<tag>uTSqUYRR8gapple</tag><tag>K9VGTZM3h8</tag><tag>pearTYysnMXMUc</tag><tag>udv5NZQdpzpearz5a4oS85mD</tag>'
soup = BeautifulSoup(s, "html5lib")
tags = soup.find_all(text=re.compile(r'pear'))
print tags
# [u'pearTYysnMXMUc', u'udv5NZQdpzpearz5a4oS85mD']

这将设置dom并查找文本与regex pear匹配的所有标记（按字面意思查找“pear”。
见a demo on ideone.com。你知道吗

网友

2楼 · 编辑于 2024-06-26 00:28:17

使用适当的XML库可以使用XPath来封装查询。例如：

s = '<root><tag>uTSqUYRR8gapple</tag><tag>K9VGTZM3h8</tag><tag>pearTYysnMXMUc</tag><tag>udv5NZQdpzpearz5a4oS85mD</tag></root>'

import lxml.etree
root = lxml.etree.fromstring(s)
result = root.xpath('//tag[contains(., "pear")][last()]/text()')

…对于它，result将包含，对于给定的输入数据，['udv5NZQdpzpearz5a4oS85mD']。在这种情况下，您不需要在自己的代码中搜索最后一项，但可以依靠XPath引擎（用C实现，作为libxml的一部分）来完成这项工作。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

简单xml字符串的简单正则表达式

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >