我想刮胡子股票图表网来自url的图表图像。例如from:http://stockcharts.com/h-sc/ui?s=AMZN
但是,当检查有问题的元素时,它不是一个正确的带有.jpg、.png等后缀的图像src。例如,上面链接中有问题的元素是:http://stockcharts.com/c-sc/sc?s=AMZN&p=D&b=5&g=0&i=0&r=1479451634864
因此,当我尝试在python 2.7中使用以下代码时,在共享脚本的目录中会得到一个空文件:
import urllib
url = "http://stockcharts.com/c-sc/sc?s=AMZN&p=D&b=5&g=0&i=0&r=1479451634864"
filename = "testimg.jpg"
urllib.urlretrieve(url, filename)
这是一个javascript呈现的页面,还是我遗漏了什么?是指其他地方吗?在
站点检查
User-Agent
头;它只允许特定的用户代理。在您需要更改标题以获取图像。否则,站点返回403禁止响应。在
^{} 不接受其他标头,您需要使用^{} /^{} 来指定自定义标头并自己保存文件:
相关问题 更多 >
编程相关推荐