合并数据帧的特定行并删除未使用的行

details endFrame id indexID object startFrame 'series of numbers’ 1111 78 0 Motorbike 1 'series of numbers’ 3647 78 1 Motorbike 1112 'series of numbers’ 3678 78 2 Motorbike 3649 'series of numbers’ 704 120 3 Pedestrian 66 'series of numbers’ 817 120 4 Pedestrian 705 'series of numbers’ 922 120 5 Pedestrian 818 'series of numbers’ 121 110 6 Pedestrian 69 'series of numbers’ 140 109 7 Pedestrian 69 'series of numbers’ 4161 109 8 Pedestrian 140 'series of numbers’ 4344 109 9 Pedestrian 4163 'series of numbers’ 3603 79 10 Motorbike 70

details id indexID 'series of numbers’'series of numbers’'series of numbers’ 78 0 'series of numbers’'series of numbers’'series of numbers’ 120 3 'series of numbers’ 110 6 'series of numbers’'series of numbers’'series of numbers’ 109 7 'series of numbers’ 79 10

details id indexID [series of numbers][series of numbers][series of numbers] 78 0 [series of numbers][series of numbers][series of numbers] 120 3 [series of numbers] 110 6 [series of numbers][series of numbers][series of numbers] 109 7 [series of numbers] 79 10

details id indexID [series of numbersseries of numbersseries of numbers] 78 0 [series of numbersseries of numbersseries of numbers] 120 3 [series of numbers] 110 6 [series of numbersseries of numbersseries of numbers] 109 7 [series of numbers] 79 10

2条回答

网友
1楼 · 编辑于 2024-09-30 03:22:23

用^{}替换^{}中匹配的值以替换缺少的值，并用以前的值向前填充：
g = df1['indexID'] .mask(df1['indexID'].isin(df2['matchID'])).ffill().astype(int) print (g) 0 0 1 0 2 0 3 3 4 3 5 3 6 6 7 7 8 7 9 7 10 10 Name: indexID, dtype: int32
然后将groupby与join一起使用：
#if want grouping only be new Series g df = df1.groupby(g).agg({'details':' '.join, 'id':'first'}).reset_index() print (df) indexID details id 0 0 'series of numbers' 'series of numbers' 'serie... 78 1 3 'series of numbers' 'series of numbers' 'serie... 120 2 6 'series of numbers' 110 3 7 'series of numbers' 'series of numbers' 'serie... 109 4 10 'series of numbers' 79
#or also by id column df = df1.groupby(['id',g], sort=False)['details'].agg(' '.join).reset_index() print (df) id indexID details 0 78 0 'series of numbers' 'series of numbers' 'serie... 1 120 3 'series of numbers' 'series of numbers' 'serie... 2 110 6 'series of numbers' 3 109 7 'series of numbers' 'series of numbers' 'serie... 4 79 10 'series of numbers'

网友
2楼 · 编辑于 2024-09-30 03:22:23

这将起作用：
df = df.sort_values(['id']) .groupby('id', sort=False).details .apply(''.join)

相关问题更多 >

编程相关推荐

热门问题

热门文章