组合行,其中对于不同的列需要不同的操作

2024-10-06 07:36:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我尝试合并某些行,但不是对所有列使用一个公共操作。我想要pbheadid和wpadr相等的行,就像其他行一样。这里pickqty应该求和,其他列应该从最后一个条目或最高pickdtm复制粘贴,但是它是排序的,所以最后一个条目就可以了

我可以预先搜索索引并将它们保存在字典中。并根据这些索引更改每一行/每一列。然而,这并不是那么直接和快速。我认为熊猫群居应该有可能更快。我们将不胜感激。这是一段数据(请注意,pbheadid类似,但在较大的数据集中确实发生了变化):

pbheadid    pbcarid     artid   wpadr   pickqty pickdtm

76079450    61838504    370944  523-370p    1   00:00:47
76079450    61838110    323775  523-372p    1   00:01:05
76079450    61838225    323775  523-372p    2   00:01:13
76079450    61838504    323775  523-372p    3   00:01:30
76079450    61838497    355475  523-373p    1   00:01:45
76079450    61838504    354194  523-377p    1   00:01:55
76079450    61838110    267204  523-376p    5   00:02:26
76079450    61838225    267204  523-376p    1   00:02:33

结果应该是:

pbheadid    pbcarid     artid   wpadr   pickqty pickdtm
76079450    61838504    370944  523-370p    1   00:00:47
76079450    61838504    323775  523-372p    6   00:01:30
76079450    61838497    355475  523-373p    1   00:01:45
76079450    61838504    354194  523-377p    1   00:01:55
76079450    61838225    267204  523-376p    6   00:02:33

非常感谢


Tags: 数据字典排序条目复制粘贴群居artidwpadr
1条回答
网友
1楼 · 发布于 2024-10-06 07:36:00

IIUC你可以这样做:

In [21]: (df.groupby(['pbheadid','wpadr'])
   ....:    .agg({'pickqty':'sum', 'artid':'last', 'pbcarid':'last', 'pickdtm':'last'})
   ....:    .reset_index()
   ....: )
Out[21]:
   pbheadid     wpadr   artid  pickqty   pbcarid   pickdtm
0  76079450  523-370p  370944        1  61838504  00:00:47
1  76079450  523-372p  323775        6  61838504  00:01:30
2  76079450  523-373p  355475        1  61838497  00:01:45
3  76079450  523-376p  267204        6  61838225  00:02:33
4  76079450  523-377p  354194        1  61838504  00:01:55

相关问题 更多 >