如何通过比较数据中的多列找到最大值的列名

2024-10-02 20:32:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要在许多列中有相同值的列名,我需要在另一列中选取最后一个最大值列名。 例如

   KEY    A    B    C    D    E   F
0    1  100  100  100  100   50  50
1    2  200  200  200   50  200  50

输出应该是

   KEY    A    B    C    D    E   F  G
0    1  100  100  100  100   50  50  D
1    2  200  200  200   50  200  50  E

请帮我得到结果。我试过使用.idxmax(axis=1),它会拉取第一个引用并给我第一个列名。你知道吗

我有一个像df这样的数据帧

SITE    Counter KEY Full_name   B   C   D   E   F
LO  ALA LO_ALA  ALPHA   100 100 100 50  50
LO  BLA LO_BLA  BALPA   200 200 50  200 50
LO  ALA LO_ALA  ALPHA   1000    1000    1000    100 1000
LO  BLA LO_BLA  BALPA   2000    2000    100 2000    1000

我运行查询

df['G'] = df[["B","C","D","E","F"]].values.max(1)
df = df.sort_values(['MAX_LIMIT'], ascending=[0])
df = df.drop_duplicates(['KEY'], keep='first')

在上面的代码之后,我为每个键得到一个值,然后我需要的是与最后一个匹配的列名

接下来我运行df['H'] =df[["B","C","D","E","F"]].idxmax(axis =1)

我需要输出为

SITE    Counter KEY Full_name G     H
LO  ALA LO_ALA  ALPHA   1000    F   
LO  BLA LO_BLA  BALPA   2000    E

但我得到的结果是

SITE    Counter KEY Full_name G     H
LO  ALA LO_ALA  ALPHA   1000    B   
LO  BLA LO_BLA  BALPA   2000    B

Tags: 数据keynamealphalodfcountersite
1条回答
网友
1楼 · 发布于 2024-10-02 20:32:47

反转列并找到idxmax

df.set_index('KEY', inplace=True)
df[df.columns[::-1]].idxmax(axis=1)

KEY
1    D
2    E
dtype: object

编辑:更改查询,如:

df['G'] = df[["B","C","D","E","F"]].values.max(1)
df = df.drop_duplicates(['KEY'], keep='last')
df['H'] = df[df.columns[4:-1][::-1]].idxmax(axis=1)

print(df)
  SITE Counter     KEY Full_name     B     C     D     E     F     G  H
2   LO     ALA  LO_ALA     ALPHA  1000  1000  1000   100  1000  1000  F
3   LO     BLA  LO_BLA     BALPA  2000  2000   100  2000  1000  2000  E

相关问题 更多 >