pandas.DataFrame.from_dict不使用OrderedDi保存订单

from collections import OrderedDict from lxml import etree import requests import pandas as pd # CBS URLs base_url = 'http://opendata.cbs.nl/ODataFeed/odata' datasets = ['/37296ned', '/82245NED'] feed = requests.get(base_url + datasets[1] + '/TypedDataSet') root = etree.fromstring(feed.content) # all record entries start at tag m:properties, parse into data dict data = [] for record in root.iter('{{{}}}properties'.format(root.nsmap['m'])): row = OrderedDict() for element in record: row[element.tag.split('}')[1]] = element.text data.append(row) df = pd.DataFrame.from_dict(data) df.columns

2条回答

网友

1楼 · 编辑于 2024-04-26 23:37:47

示例中的某些内容似乎不一致，因为data是一个list，而不是dict，但假设您确实有一个OrderedDict：

创建数据帧时尝试显式指定列顺序：

# ... all your data collection
df = pd.DataFrame(data, columns=data.keys())

这将为您提供数据帧，其中列的顺序与OrderedDict中列的顺序完全相同（通过data.keys()生成的列表）

网友

2楼 · 编辑于 2024-04-26 23:37:47

上面的答案对我不起作用，并一直给我“ValueError:cannot use columns parameter with orient=”columns“。

后来，我找到了一个解决方案，我做了如下工作：

df = pd.DataFrame.from_dict (dict_data) [list (dict_data[0].keys())]

相关问题更多 >

编程相关推荐

热门问题

热门文章