在Python中建立与某个网页的连接

2024-09-27 21:30:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我必须在一个项目中工作,在这个项目中,我必须建立与web页面的连接,这样我就可以从该页面收集xmldtd模式片段,并在其上应用搜索算法来搜索用户输入的关键字。我已经用python创建了算法,但是不知道如何用python建立连接,因为我对它还不熟悉。有人能指导我吗?你知道吗

请帮忙


Tags: 项目用户算法web模式关键字页面指导
2条回答

如果您只是想获取一个网页,可以这样尝试:

import urllib2
url = 'http://www.example.com/index.html'
req = urllib2.Request(url)
response = urllib2.urlopen(req)
#now you can get the data by response.read()

我不建议为HTTP生成sockets等,因为有些lib像@fvwmer提到的urllib2,或者我个人最喜欢的twill,是浏览网站、下载内容甚至填写webforms的简单脚本语言。你知道吗

import re
import twill

go('http://www.stackoverflow.com')
content = show() #saving content in a variable
if re.search('some regex', content):
       'do something'

相关问题 更多 >

    热门问题