我正试图进入opencorporates.com网站. 页面上说这是GET方法http://api.opencorporates.com/companies/gb/00102498?api_token=ab123cd45的认证版本。在
这是我访问数据集的代码。在这里,我通过我在一个文件中收集的代码来更改辖区代码。即使我不使用api令牌,我也能够收集与api令牌相同数量的数据。我是不是做错了什么?在
import urllib2
import json,os
f = open('codes','r')
for line in f.readlines():
id = line.strip('\n')
url = 'http://api.opencorporates.com/v0.2/companies/search?q=&jurisdiction_code={0}&per_page=26¤t_status=Active&page={1}?api_token=ab123cd45'
i = 0
directory = id
os.makedirs(directory)
while True:
i += 1
req = urllib2.Request(url.format(id, i))
print url.format(id,i)
try:
response = urllib2.urlopen(url.format(id, i))
except urllib2.HTTPError, e:
break
content = response.read()
fo = str(i) + '.json'
OUTFILE = os.path.join(directory, fo)
with open(OUTFILE, 'w') as f:
f.write(content)
url的结尾看起来像这样:
?api_token=ab123cd45
,但它已经在url的查询字符串部分中,所以应该看起来是:&api_token=ab123cd45
。(将?
替换为&
。)在使用API时,应该考虑使用Requests。在
相关问题 更多 >
编程相关推荐