擅长:python、mysql、java
<p>请参阅有效的示例:</p>
<pre><code>import urllib2
import re
name = '/chapters/16.html'
url = 'http://learnvimscriptthehardway.stevelosh.com'
while len(name) > 0:
url1 = url + name
response = urllib2.urlopen(url1)
data = response.read()
address = './vim/' + name[-7:]
with open(address, 'w') as fh:
fh.write(data)
x = re.findall('''<a class="next" href="(.+?)"''', data)
if x:
name = x[0]
else:
break
</code></pre>
<p>不过,我使用的是python2.7.10。
这段代码从您指定的url下载html格式的所有章节。
注意:替换目录的“./vim/”(当前目录+vim);我使用了name[-7:],它是最后7个字符,如“16.html”等等。条件“if”(if x:…)排除“索引超出范围”错误。你知道吗</p>