我有一个如下所示的数据帧:
a b c result
0 80 50 10000 pass
1 80 50 10000 pass
2 100 50 10000 pass
3 100 50 10000 fail
...
XX 110 70 15000 pass
XX 110 70 15000 pass
XX 110 80 10000 fail
XX 110 80 10000 fail
我想得到数据帧的每个组合(a、b、c)的“通过”频率(单位%)。 例如,上述数据集应导致
a b c passFreq
0 80 50 10000 1.0
1 100 50 10000 0.5
...
2 110 70 15000 1.0
3 110 80 10000 0.0
如果我这样做
df.groupby(['a', 'b', 'c']).describe()
我得到了频率,但它没有按照我想要的方式报告,我不知道如何检索频率并从中创建新的数据集
有什么指导吗
您需要选择列
pass
,然后应用.mean()
和.reset_index(drop=True)
重置索引:如果你需要
.describe
,你也可以这样做如果需要使用^{} 列} :
result
的所有值的百分比,请使用^{如果只需要
pass
首先将值与新列进行比较,然后聚合mean
:相关问题 更多 >
编程相关推荐