我有一个数据帧df_things
,看起来像这样,我想在训练之前预测分类的质量
A B C CLASS
-----------------------
al1 bal1 cal1 Ship
al1 bal1 cal1 Ship
al1 bal2 cal2 Ship
al2 bal2 cal2 Cow
al3 bal3 cal3 Car
al1 bal2 cal3 Car
al3 bal3 cal3 Car
我想按类对行进行分组,以便了解特性的分布。我是这样做的(例如,在列“B”)
df_B = df_things.groupby('CLASS').B.value_counts()
这给了我结果
CLASS B
-------------
ship bal1 2
bal2 1
cow bal2 2
car bal2 1
bal3 2
我想要的是只可视化具有多个值的组,因此它看起来像这样:
CLASS B
-------------
ship bal1 2
bal2 1
car bal2 1
bal3 2
我有点困了,有什么想法吗?你知道吗
来自
crosstab
的溶液您可以使用
groupby
来筛选nunique
计数超过1的组。你知道吗相关问题 更多 >
编程相关推荐