如何找到列中值的稳健西格玛,然后找到上限和下限?

2024-09-30 08:33:51 发布

您现在位置:Python中文网/ 问答频道 /正文

因此,我有如下数据:

 BatchID    UnitID  Score  Median
0    A123  A123-100  0.111  0.1065
1    A123  A123-101  0.121  0.1065
2    A123  A123-102  0.101  0.1065
3    A123  A123-103  0.102  0.1065
4    B456  B456-200  0.211  0.2160
5    B456  B456-201  0.221  0.2160
6    C789  C789-001  0.199  0.1955
7    C789  C789-002  0.189  0.1955
8    C789  C789-003  0.192  0.1955
9    C789  C789-004  0.201  0.1955

每个单元(UnitID)都有一个分数,属于一个批次(批次ID)。最初,这个表没有“Median”列,但我使用了df['Median'] = df.groupby('BatchID')['Score'].transform('median')来创建它

现在我想要一个新的列,叫做“R-Sigma”,在这个列中,我将这个稳健的Sigma公式应用于每个值:

RS = IQR/1.349

我不知道如何使用IQR函数,这是我的第一个问题,也不知道如何将此计算应用于每个值

最后,我想增加两列,一列叫做“上限”,另一列叫做“下限”,其中 中值+/-6*稳健西格玛 分别计算

我怎么能这样做?我完全迷路了


Tags: 数据iddfsigma分数单元medianscore

热门问题