Key Departure Species1 Species2 Status
1 R Carlan Carlan D
1 R Scival Carex C
2 R Carlan Scival D
2 R Scival Bougra C
3 D Carlan Carlan D
3 D Scival Scival C
df['comb'] = df.Departure + df.Status
df
# Key Departure Species1 Species2 Status comb
#0 1 R Carlan Carlan D RD
#1 1 R Scival Carex C RC
#2 2 R Carlan Scival D RD
#3 2 R Scival Bougra C RC
#4 3 D Carlan Carlan D DD
#5 3 D Scival Scival C DC
可以对多个列使用a groupby查询,然后使用聚集函数计算发生次数:
使用熊猫.交叉表()方法。一行代码:
结果表:
如果你和@dermen的“梳子”栏结合
^{pr2}$您将获得:
如果你真的想要那些“NaN”,只需添加一个
.replace('0', np.nan)
,就像这样(假设import numpy as np
已经完成):创建一个新列,该列是离开和状态的组合
然后您可以按以下方式分组:
^{pr2}$现在将结果组织到一个列表中,其中每个元素是一个元组
(column, Series(data, index))
,表示新数据帧中的单个数据点并从这些项生成一个新的数据帧:
额外信息
请参见this link,了解如何从不同对象装箱新的数据帧。当您想从单个数据点(例如(Species1,comb))创建一个数据帧时,
from_items
是您的最佳选择。在相关问题 更多 >
编程相关推荐