如何对具有相似名称的行求和

2024-09-30 00:22:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个像这样的数据框

enter image description here

每行都有自己的副本,前缀为“治疗组”,但系数不同。 如何使用以下逻辑在整个数据帧中按coef对这些行求和:sum=TREATION\U group:feature 19+feature 19


Tags: 数据副本group逻辑featuresum系数coef
2条回答

您可以将split与select last value一起使用,它适用于聚合sum的任何值:

df.groupby(df.index.str.split(':').str[-1]).sum()

或使用replace

df.groupby(df.index.str.replace('treatment_group:', '', regex=True)).sum()

与注释中提到的@mozway一样,可以提取索引中的最后一个数字(添加expand=False以返回Series):

df.groupby(df.index.str.extract('(\d+)$', expand=False)).sum()

只要做:

df.groupby(df.index.str.extract('(\d+)$')).sum()

相关问题 更多 >

    热门问题