根据条件使用前一列的聚合创建列

FLAG CLASS STUDENT ALL_STUD yes 'Sci' 'Francy' 'Francy, Alex' no 'Sci' 'Alex' NaN yes 'math' 'Arthur' 'Arthur, Paul' yes 'math' NaN 'Arthur, Paul' yes 'eng' 'Jack' 'Jack, Zach' yes 'math' 'Paul' 'Arthur, Paul' yes 'eng' 'Zach' 'Jack, Zach'

1条回答

网友

1楼 · 发布于 2024-06-01 08:41:58

使用^{}：

f = lambda x: ','.join(x.dropna())
#alternative 
#f = lambda x: ','.join(y for y in x if y == y)
df.loc[df['FLAG']=='yes', 'ALL_STU'] = df.groupby('CLASS').STUDENT.transform(f)
print (df)
  FLAG   CLASS   STUDENT          ALL_STU
0  yes   'Sci'  'Francy'  'Francy','Alex'
1   no   'Sci'    'Alex'              NaN
2  yes  'math'  'Arthur'  'Arthur','Paul'
3  yes  'math'       NaN  'Arthur','Paul'
4  yes   'eng'    'Jack'    'Jack','Zach'
5  yes  'math'    'Paul'  'Arthur','Paul'
6  yes   'eng'    'Zach'    'Jack','Zach'

也可以在两侧进行筛选，以避免附加不匹配条件的值：

mask = df['FLAG']=='yes'
f = lambda x: ','.join(x.dropna())
df.loc[mask, 'ALL_STU'] = df.loc[mask, 'STUDENT'].groupby(df['CLASS']).transform(f)
print (df)
  FLAG   CLASS   STUDENT          ALL_STU
0  yes   'Sci'  'Francy'         'Francy'
1   no   'Sci'    'Alex'              NaN
2  yes  'math'  'Arthur'  'Arthur','Paul'
3  yes  'math'       NaN  'Arthur','Paul'
4  yes   'eng'    'Jack'    'Jack','Zach'
5  yes  'math'    'Paul'  'Arthur','Paul'
6  yes   'eng'    'Zach'    'Jack','Zach'

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据条件使用前一列的聚合创建列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >