多变量分组运算

library(dplyr) DF <- data.frame('ID'=c(1, 1, 1, 2, 2, 2), 'A'=c(1, 2, 3, 4, 5, 6), 'B'=c(2, 4, 6, 8, 10, 12)) IDgp <- group_by(DF, ID) %>% summarise(C = prod(B) / sum(A)) ### # Output: ### ### > DF ### ID A B ### 1 1 1 2 ### 2 1 2 4 ### 3 1 3 6 ### 4 2 4 8 ### 5 2 5 10 ### 6 2 6 12 ### ### > IDgp ### # A tibble: 2 x 2 ### ID C ### <dbl> <dbl> ### 1 1 8 ### 2 2 64

2条回答

网友

1楼 · 编辑于 2024-10-03 04:34:59

耶斯雷尔提到的apply方法是可行的。你知道吗

或者，如果要存储中间结果并通过链接分配新值，可以使用.agg和.assign。你知道吗

In [251]: df.groupby('ID').agg({'A': 'sum', 'B': 'prod'}).assign(C=lambda x: x.B/x.A)
Out[251]:
     A    B     C
ID
1    6   48   8.0
2   15  960  64.0

网友

2楼 · 编辑于 2024-10-03 04:34:59

您可以使用^{}：

df = df.groupby('ID').apply(lambda x: x['B'].prod() / x['A'].sum()).reset_index(name='C')
print (df)
   ID     C
0   1   8.0
1   2  64.0

用^{}和^{}除以^{}的另一个解：

g = df.groupby('ID')
df = g['B'].prod().div(g['A'].sum()).reset_index(name='C')
print (df)
   ID     C
0   1   8.0
1   2  64.0

同：

df = df.groupby('ID')['B'].prod().div(df.groupby('ID')['A'].sum()).reset_index(name='C')
print (df)
   ID     C
0   1   8.0
1   2  64.0

相关问题更多 >

编程相关推荐

热门问题

热门文章