搜索正则表达式时忽略子节点

t1 = BeautifulSoup("Question-And-Answer") t2 = BeautifulSoup("Question-And-Answer") t1.find(text = re.compile("Question[s]*-And-Answer[s]*", re.IGNORECASE)) >>> 'Question-And-Answer' t2.find(text = re.compile("Question[s]*-And-Answer[s]*", re.IGNORECASE)) >>> None

1条回答

网友

1楼 · 发布于 2024-10-05 15:21:53

这里的问题是，您要查找的文本在p节点内用strong标记分割，因此在.find中使用text参数的regex搜索将不起作用，这只是它在BS中的实现方式。你知道吗

如果您知道文本在p节点中，可以在.find调用中使用lambda表达式，并对每个p标记的text属性运行regex搜索，以找到所需的元素：

print(t2.find(lambda t: t.name == "p" and re.search(r'Questions*-And-Answers*', t.text)))
# => <p class="p p8"><strong>Question</strong>-<strong>And</strong>-<strong>Answer</strong></p>

注意[s]与regex中的s相同。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

搜索正则表达式时忽略子节点

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >