如何在一个系列中得到N个最接近中位数的条目?

2024-06-01 19:10:53 发布

您现在位置:Python中文网/ 问答频道 /正文

对于熊猫系列:

ser = pd.Series([i**2 for i in range(9)])
print(ser)
0     0
1     1
2     4
3     9
4    16
5    25
6    36
7    49
8    64
dtype: int64

中位数可以用ser.median()获取,它返回16。如何获取中位数周围的N条目?比如:

print(ser.get_median_entries(3)) # N == 3; not real functionality
3     9
4    16
5    25
dtype: int64

Tags: inforgetnot条目rangeserseries
2条回答

对于你的问题,你可以根据你的问题来实现这个逻辑。你知道吗

data={j:i**2 for j,i in enumerate(range(0,9))}
median=16

def nearby_values(data,median,depth):
    #subtract each value from median and then slice only three from sorted
    return list(map(lambda x:x[1],sorted([(abs(median-j),j) for i,j in data.items()])[:depth]))
print(nearby_values(data,median,3))

输出:

[16, 9, 25]

您可以找到每个值和中值之间的abs差,并使用sort_values()

ser[abs(ser - ser.median()).sort_values()[0:3].index]
#4    16
#3     9
#5    25
#dtype: int64

如果要将其作为函数,其中n是一个输入变量:

def get_n_closest_to_median(ser, n):
    return ser[abs(ser - ser.median()).sort_values()[0:n].index]

print get_n_closest_to_median(ser, 3)
#4    16
#3     9
#5    25
#dtype: int64

您可能需要在边界上添加一些错误检查。你知道吗

相关问题 更多 >