为列B中的每个唯一值获取列A中的唯一值列表

Index Name Likes Food 0 Tim Pizza 1 Marie Pizza 2 Tim Pasta 3 Tim Pizza 4 John Pizza 5 Amy Pizza 6 Amy Sweet Potatoes 7 Marie Sushi 8 Tim Sushi

df.groupby( by='Name', as_index=False ).agg( {'Likes Food': pandas.Series.nunique} ) df.sort_values(by='Likes Food', ascending=False) df.reset_index( drop=True ) >>> Index Name Likes Food 0 Tim 3 1 Marie 2 2 Amy 2 3 John 1

<code here> >>> Index Name Likes Food Food List 0 Tim 3 [Pizza, Pasta, Sushi] 1 Marie 2 [Pizza, Sushi] 2 Amy 2 [Pizza, Sweet Potatoes] 3 John 1 [Pizza]

2条回答

网友

1楼 · 编辑于 2024-09-26 17:50:55

要同时对这两列进行排序，请尝试以下操作：

df = df.groupby("Name")["Likes_Food"].aggregate({'counts': 'nunique',
                                            'food_list': 'unique'}).reset_index().sort_values(by='counts', ascending=False)
df
   Name  counts               food_list
3    Tim       3   [Pizza, Pasta, Sushi]
0    Amy       2  [Pizza, SweetPotatoes]
2  Marie       2          [Pizza, Sushi]
1   John       1                 [Pizza]

网友

2楼 · 编辑于 2024-09-26 17:50:55

要获得没有计数的输出，只需尝试unique

df.groupby("Name")["Likes"].unique()
Name
Amy             [Pizza, Sweet Potatoes]
John                            [Pizza]
Marie                    [Pizza, Sushi]
Tim               [Pizza, Pasta, Sushi]
Name: Likes, dtype: object

此外，还可以使用named aggregation

df.groupby("Name").agg(**{"Likes Food": pd.NamedAgg(column='Likes', aggfunc="size"),
                          "Food List": pd.NamedAgg(column='Likes', aggfunc="nunique")}).reset_index()
    Name  Likes Food              Food List
0    Amy           2         [Pizza, Sweet Potatoes]
1   John           1                         [Pizza]
2  Marie           2                  [Pizza, Sushi]
3    Tim           3           [Pizza, Pasta, Sushi]

相关问题更多 >

编程相关推荐

热门问题

热门文章