在Pandas Datafram中分组列

2024-10-17 16:25:49 发布

您现在位置:Python中文网/ 问答频道 /正文

如果有人能帮我解决熊猫的数据帧问题,我将不胜感激。在

我试图按列对pandas数据帧进行分组,但不确定如何继续。我有一个具有重复列名(a和B)的dataframe,并希望将这些列名分组以返回a和B的最大值

重复列数据帧

index      | A | A | A | B | B |
--------------------------------
2015-01-01 |   | 1 | 7 | 1 |   |
--------------------------------
2015-01-02 | 3 |   |   |   | 5 |

处理后的数据帧

^{pr2}$

这不起作用,因为我得到一条关于石斑鱼的错误信息不是一维的。我还尝试过转换数据帧并按行分组。但是我收到了一条索引错误消息(索引0超出了大小为0的轴0的界限)

问题:

如何将具有重复列的数据帧分组以从组中返回最大值?在


Tags: 数据消息dataframepandasindex错误界限pr2
1条回答
网友
1楼 · 发布于 2024-10-17 16:25:49

我认为您需要先按子集筛选列,然后按level=0axis=1对所有列值进行groupby

cols = ['A','B']   
df = df[cols].groupby(level = 0, axis = 1).max()
print (df)
              A    B
index               
2015-01-01  7.0  1.0
2015-01-02  3.0  5.0

如有必要,最后转换为int

^{pr2}$

相关问题 更多 >