擅长:python、mysql、java
<p>Regex不是解析html文件的正确工具。因为你的意思,我发布了这个解决方案。在</p>
<pre><code>>>> import re
>>> file = open("/Users/shannonmcgregor/Desktop/npr.txt", 'r')
>>> for i in file:
if re.search('<a href="[^>"]*(islamic|praying|marines|comets|dyslexics)', i):
i = re.sub(r'^.*?<a href="([^"]*)".*', r'\1', i)
print(i)
</code></pre>
<p><strong>或</strong></p>
^{pr2}$