我正在尝试从http://www.pingshu8.com/down_121010.html下载一些音频剪辑
通过使用scrapy,我获得了真正的文件链接:
from urllib.parse import unquote
fetch('http://www.pingshu8.com/down_121008.html')
downurl=response.xpath('//script/text()').extract()[0]
downurl=unquote(unquote(downurl))
downurl1=response.urljoin(re.search('bzmtv_Inc/download.asp\?fid=\d+&t=\d+',downurl).group())
但当我使用
fetch(downurl1)
我得到了200个状态,而不是301重定向到正确的网址
我发现只有当我点击下载按钮时才能得到正确的结果
网站同时检查Referer和用户代理:
带有标题的示例输出:
相关问题 更多 >
编程相关推荐