查找以.rss结尾的带有python beautifulsoup4的url

2条回答

网友

1楼 · 编辑于 2024-07-04 05:26:31

您可以使用re模块并传递正则表达式模式以匹配属性，例如，要匹配字符串末尾的rss，可以使用rss$：

soup = BeautifulSoup("""<a href="http://trailers.apple.com/trailers/home/rss/newtrailers.rss"></a>
<a href="http://trailers.apple.com/trailers/home/rss/newtrailers"></a>""", "html.parser")

import re
soup.find_all("a", {"href": re.compile("rss$")})
# [<a href="http://trailers.apple.com/trailers/home/rss/newtrailers.rss"></a>]

网友

2楼 · 编辑于 2024-07-04 05:26:31

您可以遍历页面中找到的所有a标记，并检查它们的href字段是否以.rss结尾

for link in page.findAll(`a`):
    if link['href'].endswith('.rss'):
        **do something**

编程相关推荐

java如何从旧的ArrayList<ArrayList<Integer>>创建新的ArrayList而不更改旧的？
java JBoss 7 |从随机线程写入jndi
java如何在数据库中有空值的JPA实体中迭代联接列
java Android应用程序在setContentView上崩溃
java如何在表单中预先填充文本字段，其中包含数据库中的信息。jsp？
来自R.raw的java Android文件阅读器。文件
如何将多个WAR（或Java Web应用程序，特别是使用Spring MVC）嵌入到一个承载另一个WAR的网页中？
java动态更新Jlist
gwt分页大结果集Java的最佳方式是什么
JavaCDI：为什么我的瞬态字段被序列化？

相关问题更多 >

编程相关推荐

热门问题

热门文章

查找以.rss结尾的带有python beautifulsoup4的url

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >