添加不带循环的groupby操作中元素编号的列

df = pd.DataFrame({ 'name': ['Name1','Name2','Name3','Name4','Name5','Name6', 'Name7', 'Name8'], 'group':['GroupB','GroupB','GroupB','GroupA','GroupA','GroupA', 'GroupC', 'GroupC'], 'revenue':[1,2,3,4,5,6,11,22]} )

group name revenue 0 GroupB Name1 1 1 GroupB Name2 2 2 GroupB Name3 3 3 GroupA Name4 4 4 GroupA Name5 5 5 GroupA Name6 6 6 GroupC Name7 11 7 GroupC Name8 22

group name revenue Group_internal_id 0 GroupA Name4 4 0 1 GroupA Name5 5 1 2 GroupA Name6 6 2 3 GroupB Name1 1 0 4 GroupB Name2 2 1 5 GroupB Name3 3 2 6 GroupC Name7 11 0 7 GroupC Name8 22 1

numbering_function = lambda x: range(len(x.index)) outDF = pd.DataFrame() for iK, iDF in df.groupby('group'): tempDF = iDF.copy() tempDF['Group_internal_id'] = numbering_function(tempDF) outDF = outDF.append(tempDF, ignore_index=True)

group name revenue Group_internal_id 0 GroupA Name4 4 0 1 GroupA Name5 5 1 2 GroupA Name6 6 2 3 GroupB Name1 1 0 4 GroupB Name2 2 1 5 GroupB Name3 3 2 6 GroupC Name7 11 0 7 GroupC Name8 22 1

1条回答

网友

1楼 · 发布于 2024-09-26 17:58:25

您需要^{}和^{}：

df['new'] = df.groupby('group').cumcount()
df = df.sort_values('group')
print (df)
    group   name  revenue  new
3  GroupA  Name4        4    0
4  GroupA  Name5        5    1
5  GroupA  Name6        6    2
0  GroupB  Name1        1    0
1  GroupB  Name2        2    1
2  GroupB  Name3        3    2
6  GroupC  Name7       11    0
7  GroupC  Name8       22    1

相关问题更多 >

编程相关推荐

热门问题

热门文章