擅长:python、mysql、java
<p>如果你在网上练习,看看正则表达式。
这里只会得到标题链接。。。针串是匹配字符串,括号<code>(http://.*?)</code>包含匹配组。在</p>
<pre><code>import urllib2
import re
myURL = "http://www.ebizmba.com/articles/torrent-websites"
req = urllib2.Request(myURL)
Needle1 = '<p><a href="(http:.*?)" rel="nofollow" target="_blank">'
for match in re.finditer(Needle1, urllib2.urlopen(req).read()):
print(match.group(1))
</code></pre>