保存网页的Python

3条回答

网友

1楼 · 编辑于 2024-09-27 07:18:21

Mechanize是一个用python爬行web的好软件包。您的问题的一个简单示例是：

import mechanize

br = mechanize.Browser()
response = br.open("www.xyz.com/somestuff/ID")
print response

这只需获取您的url并从服务器打印响应。

网友

2楼 · 编辑于 2024-09-27 07:18:21

这可以在python中使用urllib模块简单地完成。以下是Python3中的一个简单示例：

import urllib.request

url = 'www.xyz.com/somestuff/ID'
req = urllib.request.Request(url)
page = urllib.request.urlopen(req)
src = page.readall()
print(src)

有关urllib模块的详细信息->；http://docs.python.org/3.3/library/urllib.html

网友

3楼 · 编辑于 2024-09-27 07:18:21

你只想要网站的html代码吗？如果是这样，只需创建一个带有宿主站点的url变量，并在运行时添加页码。我将以http://www.notalwaysright.com为例

import urllib.request

url = "http://www.notalwaysright.com/page/"

for x in range(1, 71):
    newurl = url + x
    response = urllib.request.urlopen(newurl)
    with open("Page/" + x, "a") as p:
        p.writelines(reponse.read())

相关问题更多 >

编程相关推荐

热门问题

热门文章

保存网页的Python

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >