2024-09-30 00:22:19 发布
网友
我有一个像这样的数据框
每行都有自己的副本,前缀为“治疗组”,但系数不同。 如何使用以下逻辑在整个数据帧中按coef对这些行求和:sum=TREATION\U group:feature 19+feature 19
您可以将split与select last value一起使用,它适用于聚合sum的任何值:
split
sum
df.groupby(df.index.str.split(':').str[-1]).sum()
或使用replace:
replace
df.groupby(df.index.str.replace('treatment_group:', '', regex=True)).sum()
与注释中提到的@mozway一样,可以提取索引中的最后一个数字(添加expand=False以返回Series):
expand=False
Series
df.groupby(df.index.str.extract('(\d+)$', expand=False)).sum()
只要做:
df.groupby(df.index.str.extract('(\d+)$')).sum()
您可以将
split
与select last value一起使用,它适用于聚合sum
的任何值:或使用
replace
:与注释中提到的@mozway一样,可以提取索引中的最后一个数字(添加
expand=False
以返回Series
):只要做:
相关问题 更多 >
编程相关推荐