擅长:python、mysql、java
<p>最好的选择是使用bs4解决方案:</p>
<p>只是一个观点:</p>
<p>如果只需要所有产品的名称,那么如果需要,还可以使用正则表达式:</p>
<pre><code>import re
pattern=r'<image:title>"(\w.+?)<\/image:title>'
with open('file.txt','r') as f: #instead of file you can directly pass the url content via bs4 parser
match=re.finditer(pattern,f.read())
for i in match:
print(i.group(1))
</code></pre>
<p>输出:</p>
<pre><code>Cassady" Sunglasses Indigo / Gunmetal
</code></pre>