如何求多个列中所有分类变量的总和

2024-10-01 04:45:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个类似这样的数据集:

id AttA AttB AttC
1   Y         Y
2        Y    

我想创建另一个列,其中包含每个案例的属性总数,如下所示:

id AttA AttB AttC TotalAtts
1   Y         Y     2
2        Y          1

我不知道该如何处理这个问题,因为我对熊猫还比较陌生。你知道吗

提前谢谢


Tags: 数据id属性案例总数陌生attbattc
2条回答

您可以使用ne('')检查数据帧中的哪些单元格不是空的,并将sum设置axis设置为1

df['TotalAtts'] = df.ne('').sum(1)

   AttA AttB AttC  TotalAtts
0    Y         Y          2
1         Y               1

如果您想要Y的计数,可以执行(df == 'Y').sum(1)。如果要计算非空值,那么可以执行df.count(1),但空字符串将按此计数。你知道吗

相关问题 更多 >