因此,我有如下数据:
BatchID UnitID Score Median
0 A123 A123-100 0.111 0.1065
1 A123 A123-101 0.121 0.1065
2 A123 A123-102 0.101 0.1065
3 A123 A123-103 0.102 0.1065
4 B456 B456-200 0.211 0.2160
5 B456 B456-201 0.221 0.2160
6 C789 C789-001 0.199 0.1955
7 C789 C789-002 0.189 0.1955
8 C789 C789-003 0.192 0.1955
9 C789 C789-004 0.201 0.1955
每个单元(UnitID)都有一个分数,属于一个批次(批次ID)。最初,这个表没有“Median”列,但我使用了df['Median'] = df.groupby('BatchID')['Score'].transform('median')
来创建它
现在我想要一个新的列,叫做“R-Sigma”,在这个列中,我将这个稳健的Sigma公式应用于每个值:
RS = IQR/1.349
我不知道如何使用IQR函数,这是我的第一个问题,也不知道如何将此计算应用于每个值
最后,我想增加两列,一列叫做“上限”,另一列叫做“下限”,其中 中值+/-6*稳健西格玛 分别计算
我怎么能这样做?我完全迷路了
目前没有回答
相关问题 更多 >
编程相关推荐