我有一个包含7列的数据帧,如下所示:
Bank Name | Number | Firstname | Lastname | ID | Date1 | Date2
B1 | 1 | ABC | EFG | 12 | Somedate | Somedate
B2 | 2 | ABC | EFG | 12 | Somedate | Somedate
B1 | 1 | DEF | EFG | 12 | Somedate | Somedate
B3 | 3 | ABC | GHI | 13 | Somedate | Somedate
B4 | 4 | XYZ | FHJ | 13 | Somedate | Somedate
B5 | 5 | XYZ | DFI | 13 | Somedate | Somedate
我想为每个ID
创建一个有4个元素的元组,这样每个元组元素代表每个ID
的(Bank Name, Number, Firstname, Lastname)
,这些元组元素的值是该ID的相应列中存在的不同元素的计数。
例如:对于ID = 12
,元组应该是(2, 2, 2, 1)
,对于{
我可以通过执行以下操作来获取特定ID的所有行:
^{2}$但是,我不知道如何对ID列中的每个值执行此操作(非常类似于SQL中的groupby子句,还可以获取count而不是行中的实际值。在
请帮忙。在
我想你需要这个:
输出将是:
^{pr2}$将^{} 与^{} 一起使用,lambda函数与^{} 一起使用:
如有必要转换为
^{pr2}$dict
:使用
apply
你可以做到或者
^{pr2}$或者,如果您希望作为数据帧而不是元组
相关问题 更多 >
编程相关推荐