我在熊猫中有这样一个数据帧:
ID rating G1 G2 G3 G4 G5 G6 G7
0 1 2.5 18 0 0 0 0 0 0
1 4 4.0 18 0 0 0 0 0 0
2 7 3.0 78 1 0 0 0 0 0
3 1 4.0 21 7 8 10 30 40 20
4 21 3.0 18 0 0 0 0 0 0
5 7 2.0 18 80 10 11 8 0 0
6 41 3.5 18 0 9 10 0 0 0
我想通过ID对所有元素进行gruoping,以便在pandas中获得一种continuos数据帧,行数组条目如下:
ID H1 H2
0 1 [2.5,18] [4.0,21,7,8,10,30,40,20]
1 4 [4.0,18] Nan
2 7 [3.0,78] [2.0, 18, 80, 10, 11,8]
3 21 [3.0,18] Nan
4 41 [3.5,18,76,9,10] Nan
你知道这是否可能吗? 谢谢
抱歉-早前被拉进了一个会议:这是我应该如何处理的:
然后用cumcount和pivot创建我们的counter列,使用交叉表。我能看到的唯一问题是,我的列表列是一个对象,不确定以后是否要对它进行进一步的操作。如果是这样的话,耶斯雷尔的解决方案会更合适。你知道吗
为遇到此问题的其他人编辑:
使用python的
.sum()
是最慢的列表连接方法之一,如果性能是一个问题,请参阅:How to make a flat list out of list of lists用途:
相关问题 更多 >
编程相关推荐