我正在尝试使用python对大型数据集进行排序。我不想重复,我不想使用“first”方法,而是希望它查看另一列并根据该值对其进行排序
如果第一列中的列组有重复项,则只应查看第二列
Name CountA CountB
Alpha 15 3
Beta 20 52
Delta 20 31
Gamma 45 43
我希望排名结束
Name CountA CountB Rank
Alpha 15 3 4
Beta 20 52 2
Delta 20 31 3
Gamma 45 43 1
目前,我正在使用df.rank(ascending=False, method='first')
您可以获取CountA中值的计数,然后根据CountA的计数大于1来过滤数据帧行。如果计数大于1,则取CountB,否则取CountA
有关更多详细信息,请参见this
可能使用排序并拉出索引:
相关问题 更多 >
编程相关推荐