我有下面的代码,基本上是执行分组操作,然后是求和。你知道吗
grouped = df.groupby(by=['Cabin'], as_index=False)['Fare'].sum()
然后我重命名这些列
grouped.columns = ['Cabin', 'testCol']
然后我将“分组”数据帧与原始数据帧合并以计算聚合。你知道吗
df2 = df.merge(grouped, on='Cabin')
这样做的目的是用“分组”数据帧中的“testCol”填充初始数据帧。你知道吗
这个代码可以优化到适合一行或类似的东西吗?你知道吗
对于} :
sum
的新列,似乎需要^{相关问题 更多 >
编程相关推荐