从google finan获取价格的页面抓取

def getPriceFromGOOGLE(self, symbol): """ gets last traded price from google for given security """ toReturn = 0.0 try: base_url = 'http://google.com/finance?q=' req = urllib2.Request(base_url + symbol) content = urllib2.urlopen(req).read() namestr = 'name:\"' + symbol + '\",cp:(.*),p:(.*),cid(.*)}' m = re.search(namestr, content) if m: data = str(m.group(2).strip().strip('"')) price = data.replace(',','') toReturn = float(price) else: print 'ERROR ' + str(symbol) + ' --- ' + str(content) except Exception, exc: print 'Exc: ' + str(exc) finally: return toReturn

3条回答

网友

1楼 · 编辑于 2024-09-28 22:51:47

有一个Google财务API：

http://code.google.com/apis/finance/docs/2.0/developers_guide_protocol.html

它有一个Python客户端库：

http://code.google.com/p/gdata-python-client/

网友

2楼 · 编辑于 2024-09-28 22:51:47

这个问题已经很老了，但选定的答案不再有效。
API已被弃用。

有一个开源项目可以从Google财务中筛选出所有公司，并将其与当前的价格进行匹配，价格为http://scrape-google-finance.compunect.com/
该项目解决了大多数问题，包括缓存、IP管理，工作稳定，不会被阻塞。
它使用内部财务公司匹配的api来筛选公司，并使用图表api来获取价格。但是它是php代码，而不是python。你仍然可以学习它如何解决任务并适应它。

网友

3楼 · 编辑于 2024-09-28 22:51:47

为了避开像Google、Wikipedia或Yahoo这样的大多数限速或bot检测，欺骗你的用户代理。

这将使您的脚本请求看起来来自最新版本的Google Chrome。

headers = {'User-Agent' : "Mozilla/5.0 (Windows NT 6.0; WOW64) AppleWebKit/534.24 (KHTML, like Gecko) Chrome/11.0.696.16 Safari/534.24"}
req = urllib2.Request(url,None,headers)
content = urllib2.urlopen(req).read()

相关问题更多 >

编程相关推荐

热门问题

热门文章