Groupby按列计数，Groupby按列中另一列的唯一值的数目

Sector Raised_By A Xavi B Ramos C Beckham B Ronaldo A Messi A Messi C Oven B Ramos C Ronaldo A Messi C Ronaldo C Beckham

Sector Total_Number_of_Times_Raised Number_unique_Raised_By Unique_Raised_By A 4 2 ['Xavi', 'Messi'] B 3 2 ['Ramos', 'Ronaldo'] C 5 3 ['Beckham', 'Ronaldo', 'Oven']

3条回答

网友

1楼 · 编辑于 2024-09-29 01:36:54

至少在版本0.25中，将agg与字典一起使用（如在另一个版本中答案），结果是一个警告：未来警告：在序列上使用dict for aggregation已弃用，将在将来的版本中删除。你知道吗

更现代的解决方案是使用命名聚合：

df.groupby('Sector').Raised_By.agg(
    Total_Number_of_Times_Raised='count',
    Number_unique_Raised_By='nunique',
    Unique_Raised_By='unique').reset_index()

网友

2楼 · 编辑于 2024-09-29 01:36:54

一个选项是^{}指定不同的aggfuncs

df.pivot_table(index=df.Sector, values='Raised_By', aggfunc=['count', 'nunique', set])

           count   nunique                           set
       Raised_By Raised_By                     Raised_By
Sector                                                     
A              4         2                 {Messi, Xavi}
B              3         2              {Ramos, Ronaldo}
C              5         3      {Oven, Ronaldo, Beckham}

网友

3楼 · 编辑于 2024-09-29 01:36:54

您可以使用pandas.Series.aggregate：

df.groupby('Sector')['Raised_By'].agg({'Total_Number_of_Times_Raised':'count','Number_unique_Raised_By':'nunique','Unique_Raised_By':'unique'}).reset_index()

输出：

  Sector  Total_Number_of_Times_Raised  Number_unique_Raised_By  Unique_Raised_By 
0      A                             4                        2  [Xavi, Messi]  
1      B                             3                        2  [Ramos, Ronaldo] 
2      C                             5                        3  [Beckham, Oven, Ronaldo]

注：您可以在结尾使用或不使用reset_index

相关问题更多 >

编程相关推荐

热门问题

热门文章