pandas与多索引数据帧中最常见的值分离

1条回答

网友

1楼 · 发布于 2024-09-29 19:22:05

首先，计算一个特定的DLang发生的次数，在GridCode上取平均值。在

g = df.groupby(['User','DLang']).count().reset_index()
g = g.rename(columns={'GridCode':'occurrences'})

然后，使用first()函数来查找每个用户最频繁/最多出现的次数。在

^{pr2}$

将最频繁/最大出现次数的数据流与原始输入合并。这将删除用户使用DLang而不是最常用的DLang的行

^{3}$

最后，对所有用户进行平均，以获得最终计数。在

final_df = j.groupby(['GridCode','DLang']).size().unstack().fillna(0)

DLang     ca  en  es
GridCode            
3          0   0   1
4          0   0   1
6          0   1   0
9          1   0   0

编程相关推荐

java如何设置apache camel groovy脚本组件的属性
java理解如何在if语句条件内创建对象
java使用访问者和复合模式构建过滤流
游戏框架上的java生成管理区（CRUD）
是java中的toString（）方法。util。日期与地区无关？
java是否可以扩展AppIUMFieldCorator类以使其接受自定义注释？
内存管理java jvm最大和最小堆选项
JavaSpringMVC：正确的异常处理
java保存拖放图像按钮的位置
java如何使用replaceAll（）替换算术（即0+1）

相关问题更多 >

编程相关推荐

热门问题

热门文章

pandas与多索引数据帧中最常见的值分离

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >