熊猫映射json列表到数据框的惯用方法

2条回答

网友

1楼 · 编辑于 2024-06-01 09:39:57

好吧，这不会让你达到你想去的地方，但我很高兴尝试，所以我想我会分享这个，因为为什么不呢？你知道吗

import pandas as pd

popo = {'foo': 3.14, 'bar': [1, 2, 3]}
df = pd.DataFrame.from_dict([popo]*10)
df

输出：

        bar     foo
0   [1, 2, 3]   3.14
1   [1, 2, 3]   3.14
2   [1, 2, 3]   3.14
3   [1, 2, 3]   3.14
4   [1, 2, 3]   3.14
5   [1, 2, 3]   3.14
6   [1, 2, 3]   3.14
7   [1, 2, 3]   3.14
8   [1, 2, 3]   3.14
9   [1, 2, 3]   3.14

让我们定义一个函数：

def obj_sum(df, column):
   new_col = []
   for i in df[column].tolist():
           new_col.append(sum(i))
   df.drop(column, axis = 1, inplace = True)
   df[column] = new_col
   return df

最后，让我们看看这是怎么回事：

obj_sum(df,'bar')

输出：

    foo     bar
0   3.14    6
1   3.14    6
2   3.14    6
3   3.14    6
4   3.14    6
5   3.14    6
6   3.14    6
7   3.14    6
8   3.14    6
9   3.14    6

好吧，至少我试过。。。你知道吗

网友

2楼 · 编辑于 2024-06-01 09:39:57

回答我自己的问题，这是迄今为止我找到的最令人满意的答案；通过将所有列表（或iterables）强制转换为枚举dict来预处理json派生的数据结构：

def list_to_dict(popo):
    if isinstance(popo, dict):
        return {k: list_to_dict(v) for k, v in popo.items()}
    try:
        return {str(i): list_to_dict(v) for i, v in enumerate(popo)}
    except:
        return popo

现在我们有：

list_to_dict(popo) == {'foo': 3.14, 'bar': {'0': 1, '1': 2, '2': 3}}

这至少让我可以写下这样的东西：

df = pandas.io.json.json_normalize([list_to_dict(popo)] * 10)
df[[f'bar.{i}' for i in range(3)]].sum(axis=1)

不是一个巨大的球迷，因为这种预处理不是免费的，而且访问将不会有同样的效率，作为解决一个单一的连续数组。。。但也许我不得不接受。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

熊猫映射json列表到数据框的惯用方法

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >