我有HTML形式的链接
<a href="/downloadsServlet?docid=abc" target="_blank">Report 1</a>
<a href="/downloadsServlet?docid=ixyz" target="_blank">Fetch Report 2 </a>
我可以得到一个以上表格的链接使用美丽组
我的代码如下
^{pr2}$但是,我想找到在引用链接的文本中有单词“Fetch”的链接。在
我试过了
soup.findAll('a', re.compile(".*Fetch.*"))
但这行不通。如何仅选择包含href且文本部分包含单词“Fetch”的标记a?在
regex在这里可能是一种过度使用,但它允许可能的扩展:
您可以使用regex作为过滤器,它将使用
re.search
方法来过滤我们的标签。在text/string
是标记的文本值,text = re.compile("Fetch")
表示查找文本值包含“Fetch”的标记Document
还有一件事,使用
find_all()
或findAll()
,findall()
不是bs4中的关键字相关问题 更多 >
编程相关推荐