跨行分组数据帧问题的回答

跨行分组数据帧

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我有这样一个csv： <pre><code>client1,client2,client3,client4,client5,client6,amount ,,,Comp1,,,4.475000 ,,,Comp2,,,16.305584 ,,,Comp3,,,4.050000 Comp2,Comp1,,Comp4,,,21.000000 ,,,Comp4,,,30.000000 ,Comp1,,Comp2,,,5.137500 ,,,Comp3,,,52.650000 ,,,Comp1,,,2.650000 Comp3,,,Comp3,,,29.000000 Comp5,,,Comp2,,,20.809000 Comp5,,,Comp2,,,15.100000 Comp5,,,Comp2,,,52.404000 </code></pre> 在将其读入数据帧df之后，我想分两步进行聚合： 第一步： 首先，我将金额相加： <pre><code>client1 client2 client3 client4 client5 client6 amount Comp1 7.125000 Comp2 16.305584 Comp3 56.700000 Comp4 30.000000 Comp1 Comp2 5.137500 Comp2 Comp1 Comp4 21.000000 Comp3 Comp3 29.000000 Comp5 Comp2 88.313000 </code></pre> 然后，我想按每个客户机名称进行聚合，这样，如果多个客户机像第5组一样参与，那么5.1375必须在Comp1和Comp2之间平分。这样尝试： <pre><code>df.groupby(['client1','client2','client3','client4','client5','client6']).apply(lambda x: x['amount'].sum()/len(x) if x.any().nunique()>=1 else x['amount'].sum()) client1 client2 client3 client4 client5 client6 0 0 Comp1 3.562500 1 Comp2 16.305584 2 Comp3 28.350000 3 Comp4 30.000000 4 Comp1 Comp2 5.137500 5 Comp2 Comp1 Comp4 21.000000 6 Comp3 Comp3 29.000000 7 Comp5 Comp2 29.437667 </code></pre> 预期输出为： <pre><code>Client Amount Comp1 4.475+21/3+5.1375/2+2.65 = 16.69375 Comp2 16.305584+21/3+20.809/2+15.10/2+52.404/2 = 67.462084 Comp3 4.05+52.65+29 = 85.7 Comp4 21/3+30 = 37 Comp5 20.809/2+15.10/2+52.404/2 = 44.1565 </code></pre> 我试过使用<code>sum(axis=0)</code>，但没有用。你知道吗

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

跨行分组数据帧

1 个回答

相关Python问题