B64解码json导入读取数据错误

2024-09-30 01:20:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在为一个类从github导入json数据,当我尝试转换为字典时,这些值不会停留在键值对中

以下是导入:

from pprint import pprint as pp
import base64

response = requests.get('https://api.github.com/repos/bsullins/data/contents/MonthlySales.csv')

response_json = json.loads(response.text)
csv_val = base64.b64decode(response_json['content'])

pp(csv_val)

结果是原始数据,但我不确定“\r\n”分隔符是什么。很明显,它没有正确导入,因为字符串在不同的点被切断

(b'month,sales\r\n2013-01-01,14236.9\r\n2013-02-01,4519.89\r\n2013-03-01,5569'
 b'1.01\r\n2013-04-01,28295.35\r\n2013-05-01,23648.29\r\n2013-06-01,34595.13\r'
 b'\n2013-07-01,33946.39\r\n2013-08-01,27909.47\r\n2013-09-01,81777.35\r\n2013'
 b'-10-01,31453.39\r\n2013-11-01,78628.72\r\n2013-12-01,69545.62\r\n2014-01-0'
 b'1,18174.08\r\n2014-02-01,11951.41\r\n2014-03-01,38726.25\r\n2014-04-01,341'
 b'95.21\r\n2014-05-01,30131.69\r\n2014-06-01,24797.29\r\n2014-07-01,28765.33'

当我稍后尝试使用DictReader读取数据时,它会逐字解析所有内容:

import csv

csv_dict = csv.DictReader(str(csv_val))
dict_list = []

for a in csv_dict:
    dict_list.append(a):

for a in dict_list:
    print(a)

结果如下:

OrderedDict([('b', "'")])
OrderedDict([('b', 'm')])
OrderedDict([('b', 'o')])
OrderedDict([('b', 'n')])
OrderedDict([('b', 't')])
OrderedDict([('b', 'h')])
OrderedDict([('b', ''), (None, [''])])
OrderedDict([('b', 's')])
OrderedDict([('b', 'a')])
OrderedDict([('b', 'l')])
OrderedDict([('b', 'e')])
OrderedDict([('b', 's')])
OrderedDict([('b', '\\')])
OrderedDict([('b', 'r')])
OrderedDict([('b', '\\')])
OrderedDict([('b', 'n')])
OrderedDict([('b', '2')])
OrderedDict([('b', '0')])
OrderedDict([('b', '1')])
OrderedDict([('b', '3')])
OrderedDict([('b', '-')])
OrderedDict([('b', '0')])
OrderedDict([('b', '1')])
OrderedDict([('b', '-')])
OrderedDict([('b', '0')])
OrderedDict([('b', '1')])
OrderedDict([('b', ''), (None, [''])])
OrderedDict([('b', '1')])
OrderedDict([('b', '4')])
OrderedDict([('b', '2')])
OrderedDict([('b', '3')])
OrderedDict([('b', '6')])
OrderedDict([('b', '.')])
OrderedDict([('b', '9')])
OrderedDict([('b', '\\')])
OrderedDict([('b', 'r')])
OrderedDict([('b', '\\')])
OrderedDict([('b', 'n')])
OrderedDict([('b', '2')])
OrderedDict([('b', '0')])
OrderedDict([('b', '1')])
OrderedDict([('b', '3')])
OrderedDict([('b', '-')])
OrderedDict([('b', '0')])
OrderedDict([('b', '2')])
OrderedDict([('b', '-')])
OrderedDict([('b', '0')])
OrderedDict([('b', '1')])
OrderedDict([('b', ''), (None, [''])])
OrderedDict([('b', '4')])
OrderedDict([('b', '5')])
OrderedDict([('b', '1')])
OrderedDict([('b', '9')])
OrderedDict([('b', '.')])
...

Tags: csvimportgithubnonejsonresponsevaldict
1条回答
网友
1楼 · 发布于 2024-09-30 01:20:33

我查看了apihttps://api.github.com/repos/bsullins/data/contents/MonthlySales.csv,响应有一个键,value

download_url:"https://raw.githubusercontent.com/bsullins/data/master/MonthlySales.csv"

这个url实际上包含csv的原始格式,所以让我们使用它,因为它减少了代码

from pprint import pprint as pp
import requests
import io
import csv
response = requests.get('https://raw.githubusercontent.com/bsullins/data/master/MonthlySales.csv')
csv_val = response.text
pp(csv_val)
csv_dict = csv.DictReader(io.StringIO(csv_val))
dict_list = []

for a in csv_dict:
    dict_list.append(a)

for a in dict_list:
    print(a)

您需要使用StringIO来解析csv_val的字符串值,因为csv需要字符串的内存流。见Python csv.DictReader: parse string?

相关问题 更多 >

    热门问题