如何将多个列中的最高值返回到数据集中的新列

import pandas as pd import numpy as np data = [['tom', 1,1,6,4], ['tom', 1,2,2,3], ['tom', 1,2,3,1], ['tom', 2,3,2,7], ['jim', 1,4,3,6], ['jim', 2,6,5,3]] df = pd.DataFrame(data, columns = ['Name', 'Day','A','B','C']) df = df.groupby(by=['Name','Day']).agg('sum').reset_index() df

2条回答

网友

1楼 · 编辑于 2024-09-29 08:17:02

@ShubhamSharma的答案比这更好，但这里有另一个选择：

df['New col'] = np.where((df['A'] > df['B']) & (df['A'] > df['C']), 'Apple', 'Carrot')
df['New col'] = np.where((df['B'] > df['A']) & (df['B'] > df['C']), 'Banana', df['New col'])

输出：

    Name    Day A   B   C   New col
0   jim 1   4   3   6   Carrot
1   jim 2   6   5   3   Apple
2   tom 1   5   11  8   Banana
3   tom 2   3   2   7   Carrot

网友

2楼 · 编辑于 2024-09-29 08:17:02

使用^{}沿axis=1与^{}连用：

dct = {'A': 'Apple', 'B': 'Banana', 'C': 'Carrot'}
df['New col'] = df[['A', 'B', 'C']].idxmax(axis=1).map(dct)

结果:

  Name  Day  A   B  C New col
0  jim    1  4   3  6  Carrot
1  jim    2  6   5  3   Apple
2  tom    1  5  11  8  Banana
3  tom    2  3   2  7  Carrot

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何将多个列中的最高值返回到数据集中的新列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >