如何使用urllib抓取“this”url?

2024-09-28 23:24:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我尝试使用urllib对这个文件进行爬网:http://www.anzhi.com/dl_app.php?s=68611,但总是下载错误的文件(大小更小)。不过,如果我在chrome上打开这个链接,它运行得很好,下载的文件大小是正确的。代码已附加,有什么问题?在

import urllib

apk = "http://sc.hiapk.com/Download.aspx?aid=294091"
local=r'x.apk'

webFile = urllib.urlopen(apk)

localFile = open(local, "w")
realurl = webFile.geturl()
print realurl
realFile = urllib.urlopen(realurl)
localFile.write(realFile.read())
webFile.close()
realFile.close()
localFile.close()

Tags: 文件comhttpcloselocalwwwurllibapk
2条回答

你在用什么操作系统?这行代码:

localFile = open(local, "w")

在Windows上打开一个文本模式文件,它将执行您不希望执行的操作。把它改成

^{pr2}$

(以二进制模式打开文件)使工作正常吗?在

您的代码中使用的URL与问题中询问的URL不同。使用安智网你就会得到你想要的文件。:)

相关问题 更多 >