import urllib2
url = 'http://www.example.com/index.html'
req = urllib2.Request(url)
response = urllib2.urlopen(req)
#now you can get the data by response.read()
import re
import twill
go('http://www.stackoverflow.com')
content = show() #saving content in a variable
if re.search('some regex', content):
'do something'
如果您只是想获取一个网页,可以这样尝试:
我不建议为HTTP生成sockets等,因为有些lib像@fvwmer提到的urllib2,或者我个人最喜欢的twill,是浏览网站、下载内容甚至填写webforms的简单脚本语言。你知道吗
相关问题 更多 >
编程相关推荐