我有一个列表列表-表示一个有4列和许多行的表(10000+)。在
每个子列表包含4个变量。在
这是我桌子的一小部分:
['1810569', 'a', 5, '1241.52']
['1437437', 'a', 5, '1123.90']
['1437437', 'b', 5, '1232.43']
['1810569', 'b', 5, '1321.31']
['1810569', 'a', 5, '1993.52']
第一列表示house hold ID,第二列表示家庭中的成员ID。在
第四列代表了我想对每个成员明确相加的权重。在
对于上面的示例,我希望输出为:
^{pr2}$换句话说,第1行和第5行中的权重相加,因为它们是同一用户的权重,而所有其他用户都是不同的。在
我在熊猫身上看到了一些关于群居的东西,但我不明白该怎么用它来解决我的问题。在
假设下面是您的列表,那么下面的方法就可以了:
因此,我们现在可以
^{pr2}$groupby
在家庭和成员id上,并在“权重”列中调用sum
:您可以使用dict,使用前三个元素作为键对数据进行分组:
输出:
^{pr2}$如果你想保持第一眼看到的顺序:
输出:
相关问题 更多 >
编程相关推荐