如何使用groupby创建新表并删除重复项

2条回答

网友

1楼 · 编辑于 2024-09-29 17:47:06

df：

    id       result
0   309209  Successful
1   309241  Successful
2   309241  Not Successful
3   309241  Not Successful
4   309241  Not Successful

使用^{}和^{}

df1 = df.join(pd.get_dummies(df.result,columns='result')).groupby('id').sum().reset_index()
df1['total'] = df1[df1.columns[1:]].sum(axis=1)
print(df1)

    id      Not Successful  Successful  total
0   309209  0               1           1
1   309241  3               1           4

网友

2楼 · 编辑于 2024-09-29 17:47:06

将^{}与margins一起使用，并按^{}删除最后一行：

df1 = (pd.crosstab(df['id'], df['result'], margins=True, margins_name='total')
         .iloc[:-1]
         .reset_index()
         .rename_axis(None, axis=1)
         .rename(columns={'Not Successful':'fail','Successful':'success'}))
print (df1)

       id  fail  success  total
0  309209     0        1      1
1  309241     3        1      4

另一种解决方案是^{}和^{}用于重塑，而^{}用于新列total：

df1 = (df.groupby(['id','result'])
         .size()
         .unstack(fill_value=0)
         .assign(total = lambda x: x.sum(axis=1))
         .reset_index()
         .rename_axis(None, axis=1)
         .rename(columns={'Not Successful':'fail','Successful':'success'}))

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用groupby创建新表并删除重复项

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >