我有一个如下所示的数据框
data1 =
index A_bin B_bin C_bin D_bin Decider
0 4 3 2 1 0
1 2 1 2 1 1
2 5 2 1 2 1
3 1 3 5 1 0
4 1 3 3 2 0
5 5 1 2 1 1
6 3 2 4 1 0
我想创建两个dataframe,为data1中的每个bin和每个列提供'Decider'=0
和'Decider'=1
计数
同样B_bins
和D_bins
每个都没有5个箱子,因此丢失的箱子将计为0
我想要的最终数据帧如下所示
final_data1 = (giving the count of 'Decider'=0)
bins A_0 B_0 C_0 D_0
1 2 0 0 3
2 0 1 1 1
3 1 3 1 0
4 1 0 1 0
5 0 0 1 0
最终数据2=(给出“决策者”的计数=1)
bins A_1 B_1 C_1 D_1
1 0 2 1 2
2 1 1 2 1
3 0 0 0 0
4 0 0 0 0
5 2 0 0 0
在真实的数据集中,我有300多个列和箱子,范围从1到10,最后一列是Decider。因此,任何用列名表示的代码都有点困难
怎么做
您可以在对} 进行计数,使用^{} 进行缺失索引,然后仅访问字典中的每个键以获得最终数据帧:
Decider
进行分组后创建一个字典,并在使用melt
取消激发后对其进行迭代,然后使用^{相关问题 更多 >
编程相关推荐