如何从包含嵌套字典的字典创建数据帧？

{'placement': 1, 'entrant': {'id': 8554498, 'name': 'Test'}} {'placement': 2, 'entrant': {'id': 8559863, 'name': 'Test'}} {'placement': 3, 'entrant': {'id': 8561463, 'name': 'Test'}} {'placement': 4, 'entrant': {'id': 8559889, 'name': 'Test'}} {'placement': 5, 'entrant': {'id': 8561608, 'name': 'Test'}} {'placement': 5, 'entrant': {'id': 8560090, 'name': 'Test'}} {'placement': 7, 'entrant': {'id': 8561639, 'name': 'Test'}} {'placement': 7, 'entrant': {'id': 8561822, 'name': 'Test'}} {'placement': 9, 'entrant': {'id': 8559993, 'name': 'Test'}} {'placement': 9, 'entrant': {'id': 8561572, 'name': 'Test'}}

3条回答

网友

1楼 · 编辑于 2024-09-27 23:22:07

您需要为熊猫创建适当的字典来创建数据帧。我假设这里有一个叫做字典的口述清单

pd.DataFrame(
    [
        {"placement": d["placement"], "id": d["entrant"]["id"], "name": d["entrant"]["name"]}
        for d in dictionaries
    ]
)

网友

2楼 · 编辑于 2024-09-27 23:22:07

我会这样做，也许不是最优雅的解决方案，但它是有效的。我知道你有一份每一条格言的清单，因为你一条一条地按比例排列

dList = [{'placement': 1, 'entrant': {'id': 8554498, 'name': 'Test'}},
{'placement': 2, 'entrant': {'id': 8559863, 'name': 'Test'}},
{'placement': 3, 'entrant': {'id': 8561463, 'name': 'Test'}},
{'placement': 4, 'entrant': {'id': 8559889, 'name': 'Test'}},
{'placement': 5, 'entrant': {'id': 8561608, 'name': 'Test'}},
{'placement': 5, 'entrant': {'id': 8560090, 'name': 'Test'}},
{'placement': 7, 'entrant': {'id': 8561639, 'name': 'Test'}},
{'placement': 7, 'entrant': {'id': 8561822, 'name': 'Test'}},
{'placement': 9, 'entrant': {'id': 8559993, 'name': 'Test'}},
{'placement': 9, 'entrant': {'id': 8561572, 'name': 'Test'}}]


#generate column Names I supose that you dont have writed this names to make more general the problem
d0 = dList[0]
columns = []
for key,val in d0.items():
    if not isinstance(val,dict):
        columns.append(key)
    else:
        for subkey,subval in val.items():
            columns.append(subkey)

#%% Here we are going to generate de data list (a list with a sublist for every dict
data = []
for d in dList:
    thisData = []
    for key,val in d.items():
        if not isinstance(val,dict):
            thisData.append(val)
        else:
            for subkey,subval in val.items():
                thisData.append(subval)
    data.append(thisData)


df = pd.DataFrame(data,columns=columns)

希望它对你有用，如果不让我知道的话

网友

3楼 · 编辑于 2024-09-27 23:22:07

下面是一种方法，从第一个数据帧中提取一个新的数据帧并合并它：

from itertools import chain

import pandas as pd

data = [
    [{"placement": 1, "entrant": {"id": 8554498, "name": "Test"}}],
    [{"placement": 2, "entrant": {"id": 8559863, "name": "Test"}}],
    [{"placement": 3, "entrant": {"id": 8561463, "name": "Test"}}],
    [{"placement": 4, "entrant": {"id": 8559889, "name": "Test"}}],
    [{"placement": 5, "entrant": {"id": 8561608, "name": "Test"}}],
    [{"placement": 5, "entrant": {"id": 8560090, "name": "Test"}}],
    [{"placement": 7, "entrant": {"id": 8561639, "name": "Test"}}],
    [{"placement": 7, "entrant": {"id": 8561822, "name": "Test"}}],
    [{"placement": 9, "entrant": {"id": 8559993, "name": "Test"}}],
    [{"placement": 9, "entrant": {"id": 8561572, "name": "Test"}}],
]

df = pd.DataFrame.from_dict(chain(*data))
result_df = pd.merge_asof(
    df.loc[:, df.columns != "entrant"],  # Get df without the "entrant" column
    df["entrant"].apply(pd.Series), left_index=True, right_index=True
)

结果如下：

   placement       id  name
0          1  8554498  Test
1          2  8559863  Test
2          3  8561463  Test
3          4  8559889  Test
4          5  8561608  Test
5          5  8560090  Test
6          7  8561639  Test
7          7  8561822  Test
8          9  8559993  Test
9          9  8561572  Test

相关问题更多 >

编程相关推荐

热门问题

热门文章