擅长:python、mysql、java
<p>这是因为html页面只是一个大的行。
也许你可以用这样的东西来循环:</p>
<pre><code>f = open('C:/Users/Sikander/Desktop/bradpitt.html')
text = f.read()
while('<a href="http://' in text):
#process it
text = text[text.index('<a href="http://')+16:]
</code></pre>
<p>我建议你使用美丽的汤模块收集网页中的所有链接。你知道吗</p>