如何在dataframe中组合同一对象的数据?

2024-05-03 12:42:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我们知道毛毛虫有可能变成蝴蝶,蝌蚪有可能变成青蛙。权重数据对于具有不同类型的相同名称是独占的(同一列中至少有一个等于零)。 如何组合与新数据帧同名的数据(仅保存最新类型,如果存在),如下所示

old_df = {'name':  ['a', 'b', 'b', 'c', 'd', 'd', 'e'],
        'type': ['tiger', 'caterpillar', 'butterfly', 'dolphin', 'tadpole', 'frog', 'dog'],
        'month1_weight': ['33', '0', '0', '59', '3', '0', '0'],
        'month2_weight': ['0', '0', '20', '65', '0', '10', '2'],
        }
old_dataframe = pd.DataFrame(old_df)
old dataframe:
name      type         month1_weight  month2_weight
a         tiger        33             0
b         caterpillar  0              0
b         butterfly    0              20
c         dolphin      59             65
d         tadpole      3              0
d         frog         0              10
e         dog          0              2

new dataframe:
name      type         month1_weight  month2_weight
a         tiger        33             0
b         butterfly    0              20
c         dolphin      59             65
d         frog         3              10
e         dog          0              2

1条回答
网友
1楼 · 发布于 2024-05-03 12:42:26

使用:

new_dataframe = (
    old_dataframe.groupby("name")
    .agg({
        "type": "last",
        "month1_weight": lambda s: s.astype(int).sum().astype(str),
        "month2_weight": lambda s: s.astype(int).sum().astype(str)})
    .reset_index()
)

print(new_dataframe)

这张照片是:

  name       type month1_weight month2_weight
0    a      tiger            33             0
1    b  butterfly             0            20
2    c    dolphin            59            65
3    d       frog             3            10
4    e        dog             0             2

相关问题 更多 >