groupby的代码优化

2024-09-24 00:32:08 发布

男 | 程序猿一只，喜欢编程写python代码。

我有下面的代码，基本上是执行分组操作，然后是求和。你知道吗

grouped = df.groupby(by=['Cabin'], as_index=False)['Fare'].sum()

然后我重命名这些列

grouped.columns = ['Cabin', 'testCol']

然后我将“分组”数据帧与原始数据帧合并以计算聚合。你知道吗

df2 = df.merge(grouped, on='Cabin')

这样做的目的是用“分组”数据帧中的“testCol”填充初始数据帧。你知道吗

这个代码可以优化到适合一行或类似的东西吗？你知道吗

Tags： columns 数据代码 false df index by as

1条回答

网友

1楼 · 发布于 2024-09-24 00:32:08

对于sum的新列，似乎需要^{}：

df['testCol'] = df.groupby('Cabin')['Fare'].transform('sum')