使用特定的变化变量在数据帧上重复

df1: country value A 8.518074e+11 B 1.138434e+11 C 8.745698e+10 D 7.543453e+10 E 6.387533e+10 df2: country value A 3.897267e+10 B 3.589588e+10 C 3.077954e+10 D 2.868014e+10 E 2.690948e+10

1条回答

网友

1楼 · 发布于 2024-05-06 19:10:46

首先，将country设置为每个数据帧的索引。你知道吗

df_list = [df1, df2, ...]
for i, df in enumerate(df_list):
     df_list[i] = df.set_index('country')

接下来，按轴连接它们，沿每行找到max，并重置索引。你知道吗

df = pd.concat(df_list, axis=1)\
       .max(axis=1)\
       .to_frame('max_value')\
       .reset_index()

df

  country     max_value
0       A  8.518074e+11
1       B  1.138434e+11
2       C  8.745698e+10
3       D  7.543453e+10
4       E  6.387533e+10

如果您想在结果中添加一个指示符，则需要稍微修改代码，添加一个新的indicator列，然后沿第0^个轴执行concat启用，并找到每个组的idxmax

df_list = [df1, df2, ...]
for i, df in enumerate(df_list):
     df_list[i] = df.assign(indicator=i + 1)

df = pd.concat(df_list, ignore_index=True)
df.loc[df.groupby('country')['value'].idxmax().values]

df

  country         value  indicator
0       A  8.518074e+11          1
1       B  1.138434e+11          1
2       C  8.745698e+10          1
3       D  7.543453e+10          1
4       E  6.387533e+10          1

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用特定的变化变量在数据帧上重复

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >