具有下面的数据帧,并希望添加一个新列,该列指示与groupby操作中的max关联的值。因此,我的DF将有许多这样的记录,我只想通过类似于df.groupby('B')['C'].mean().idxmax()
的方式遍历每个组,但是遍历整个DF,然后创建一个新的col,结果如下:
A B C D
0 05641 KMPV 45 056
1 05649 KMPV 45 056
2 05650 KMPV 45 056
3 05651 KMPV 45 056
4 05653 KMPV 45 056
5 05678 KMPV 45 056
6 05654 KMPV 45 056
7 05609 KMPV 45 056
8 05620 KMPV 45 056
9 05633 KMPV 45 056
10 05601 KMPV 45 056
11 05602 KMPV 45 056
12 05603 KMPV 45 056
13 05662 KMVL 23 056
14 05665 KMVL 23 056
15 05672 KMVL 23 056
16 05677 KMVL 23 056
17 05648 KMVL 23 056
18 05652 KMVL 23 056
19 05680 KMVL 23 056
20 05655 KMVL 23 056
21 05656 KMVL 23 056
22 05657 KMVL 23 056
23 05661 KMVL 23 056
24 05681 KMVL 23 056
25 05682 KMVL 23 056
26 05647 K1V4 30 056
27 05658 K1V4 30 056
新的数据帧,其中的列指示KMPV具有最高值。在
^{pr2}$更简单地说。如何从下面的groupby中选择max?换句话说,我想过滤到056->;KMPV和100->;KJRB,因为它们的数字最高,依此类推。在
A B
056 K1V4 30
KMPV 45
KMVL 23
100 KJRB 130
KNYC 84
KTEB 80
又快又脏。在
数据:
代码:
^{pr2}$结果:
相关问题 更多 >
编程相关推荐