我有这样一个数据帧:
col1 col2
0 maria apple
1 eugene apple
2 eugene banana
3 maria apple
4 maria pear
5 eugene banana
6 maria apple
我想按个人分组,看看对这个人来说最常见的水果是什么,比如:
col1 col2 col3
0 maria apple 3
1 eugene banana 2
编辑到目前为止我完成的是:
col1 col2
maria apple 2
pear 1
eugene banana 2
apple 1
与
df.groupby('col1')['col2'].value_counts()
但我不知道如何得到最大值,因为它是一个系列,而不是一个数据帧
mode
来自scipy
IIUC公司:
输出:
首先在
col1
上使用groupby()
,使用value_counts()
获得频率,然后使用sort_values()
函数按降序对值排序相关问题 更多 >
编程相关推荐