Pandas：计算子组内的百分位数？

school_id uni_id points 123 44 180 123 45 160 123 45 160 123 48 110 124 44 180 124 45 160 124 47 130 123 48 120

school_id uni_id points percentile 123 44 180 100 123 45 160 50 123 45 160 50 123 48 110 0 124 44 180 100 124 45 160 66 124 47 130 33 123 48 120 0

2条回答

网友

1楼 · 编辑于 2024-09-30 01:20:37

在计算按"school_id"分组的子组之间的数值数据秩时，可以将pct=True指定为^{}方法的附加参数：

df.assign(percentile=df.groupby("school_id")['points'].rank(pct=True).mul(100))

检查（针对一个实例）：

^{pr2}$

网友

2楼 · 编辑于 2024-09-30 01:20:37

你想在这里做几件事。在

你想让你的排名更高
你希望最低值为0，最高值为100。我称之为包容性排名

我创建了一个单独的函数来应用。在

def dense_inclusive_pct(x):
    # I subtract one to handle the inclusive bit
    r = x.rank(method='dense') - 1
    return r / r.max() * 100

df.assign(pct=df.groupby('school_id').points.apply(dense_inclusive_pct).astype(int))

   points  school_id  uni_id  pct
0     180        123      44  100
1     160        123      45   50
2     160        123      45   50
3     110        123      48    0
4     180        124      44  100
5     160        124      45   66
6     130        124      47   33
7     120        124      48    0

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas：计算子组内的百分位数？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >