2024-07-04 05:26:31 发布
网友
我正试图找到一种方法来获得类似于itunes电影预告片的rss提要url
<a href="http://trailers.apple.com/trailers/home/rss/newtrailers.rss">
如何使用beautifulsoup匹配以.rss结尾的URL?你知道吗
您可以使用re模块并传递正则表达式模式以匹配属性,例如,要匹配字符串末尾的rss,可以使用rss$:
re
rss$
soup = BeautifulSoup("""<a href="http://trailers.apple.com/trailers/home/rss/newtrailers.rss"></a> <a href="http://trailers.apple.com/trailers/home/rss/newtrailers"></a>""", "html.parser") import re soup.find_all("a", {"href": re.compile("rss$")}) # [<a href="http://trailers.apple.com/trailers/home/rss/newtrailers.rss"></a>]
您可以遍历页面中找到的所有a标记,并检查它们的href字段是否以.rss结尾
a
href
for link in page.findAll(`a`): if link['href'].endswith('.rss'): **do something**
您可以使用
re
模块并传递正则表达式模式以匹配属性,例如,要匹配字符串末尾的rss,可以使用rss$
:您可以遍历页面中找到的所有
a
标记,并检查它们的href
字段是否以.rss结尾相关问题 更多 >
编程相关推荐