Pandas数据帧枢轴内存E

2条回答

网友

1楼 · 编辑于 2024-09-27 07:33:15

我最近在执行4个数据帧之间的合并时遇到了一个非常类似的问题。

对我有用的是在groupby期间禁用索引，然后合并。

如果@Kartiks answer不起作用，请在分块数据帧之前尝试此操作。

df.groupby(['newidx', 'Code'], as_index=False)['val'].max().unstack()

网友

2楼 · 编辑于 2024-09-27 07:33:15

试着看看这是否符合你的记忆：

df.groupby(['newidx', 'Code'])['val'].max().unstack()

pivot_table不幸的是内存非常密集，因为它可能会生成多个数据副本。

如果groupby不起作用，则必须将数据帧分割成更小的片段。尽量不要分配多次。例如，如果从csv读取：

df = pd.read_csv('file.csv').groupby(['newidx', 'Code'])['val'].max().unstack()

避免多次分配。