如何计算第二大值并在Python中为其添加另一列

features = ['c1'] secondLargest = all_data.groupby(['Id'])[features].apply( lambda x:x.nlargest(2,features)).reset_index() all_data = pd.merge(all_data, secondLargest.reset_index(), suffixes=["", "_secondLargest"], how='left', on=['Id'])

2条回答

网友

1楼 · 编辑于 2024-10-03 02:42:50

使用nth+sort_values

df['second_largest'] = df.sort_values(by='c1').groupby('id').transform('nth', -2)

   id  c1  second_largest
0   1   3              34
1   1  34              34
2   1  75              34
3   2  84              84
4   2  54              84
5   2  23              84
6   2  96              84
7   3  55              55
8   3  76              55

索引对齐将得到的序列放回初始数据帧。你知道吗

网友

2楼 · 编辑于 2024-10-03 02:42:50

IIUC您需要：

df.merge(df.groupby('id')['c1'].apply(lambda x : x.max()).reset_index().rename(columns={'c1':'c1_secondLargest'}),on='id')

或：

print(df.merge(df.groupby('id')['c1'].apply(lambda x : x.nlargest(1)).reset_index().rename(columns={'c1':'c1_secondLargest'}).drop('level_1',axis=1),on='id'))


   id  c1  c1_secondLargest
0   1   3                75
1   1  34                75
2   1  75                75
3   2  84                96
4   2  54                96
5   2  23                96
6   2  96                96
7   3  55                76
8   3  76                76

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何计算第二大值并在Python中为其添加另一列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >