Pandas用数组更新列

网友

1楼 · 编辑于 2024-05-20 18:46:28

创意之和！
生成A单值列表。然后用sum进行转换。在

df.assign(
    C=pd.Series(
        df.A.values[:, None].tolist(), df.index
    ).groupby(df.B).transform('sum')
)

   A  B          C
0  1  x  [1, 3, 4]
1  2  y     [2, 5]
2  3  x  [1, 3, 4]
3  4  x  [1, 3, 4]
4  5  y     [2, 5]

网友

2楼 · 编辑于 2024-05-20 18:46:28

您可以首先基于列B进行聚合，然后在^{上与原始df连接：

df
#   A   B
#0  1   x
#1  2   y
#2  3   x
#3  4   x
#4  5   y

df.groupby('B').A.apply(list).rename('C').reset_index().merge(df)

#   B           C   A
#0  x   [1, 3, 4]   1
#1  x   [1, 3, 4]   3
#2  x   [1, 3, 4]   4
#3  y      [2, 5]   2
#4  y      [2, 5]   5

网友

3楼 · 编辑于 2024-05-20 18:46:28

您可以使用transform来创建列表。在

In [324]: df['C'] = df.groupby('B')['A'].transform(lambda x: [x.values])

In [325]: df
Out[325]:
   A  B          C
0  1  x  [1, 3, 4]
1  2  y     [2, 5]
2  3  x  [1, 3, 4]
3  4  x  [1, 3, 4]
4  5  y     [2, 5]

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas用数组更新列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >