擅长:python、mysql、java
<p>有几种方法可以做到这一点,让人想到其他人已经提到过的一种方法是使用<strong>regex</strong>和<code>findall</code>一起返回我们的<code>url_list</code>中匹配的URL列表</p>
<p>另一个选项也可以是<strong>BeautifulSoup</strong>,但如果没有更多关于<code>html</code>结构的信息,它可能不是这里最好的工具</p>
<p><strong>使用Regex</strong></p>
<pre><code>from re import findall
from requests import get
def check_link(response):
result = findall(
r'.*?\b.m3u8\b',
str(response.content),
)
return result
def main(url):
response = get(url)
if response.ok:
link_found = check_link(response)
if link_found:
print('link {} found at {}'.format(
link_found,
url,
),
)
if __name__ == '__main__':
url_list = [
'http://www.test_1.com',
'http://www.test_2.com',
'http://www.test_3.com',
]
for url in url_list:
main(url)
print("All finished")
</code></pre>