我试图找到一种简单的方法将一个数据帧转换成另一个具有每个特征频率的数据帧。下面我将提供一个我正在尝试做的示例
当前数据帧示例(此处要素标签仅为索引值):
0 1 2 3 4 ... n
0 2 3 1 4 2 ~
1 4 3 4 3 2 ~
2 2 3 2 3 2 ~
3 1 3 0 3 2 ~
...
m ~ ~ ~ ~ ~ ~
Dataframe我想将其转换为:
0 1 2 3 4 ... n
0 0 1 2 1 1 ~
1 0 0 1 2 2 ~
2 0 0 3 2 0 ~
3 1 1 1 2 0 ~
...
m ~ ~ ~ ~ ~ ~
正如您所看到的,列标签对应于数据帧中可能的数字,并且该数字每行的每个频率都被放入所讨论行的特定功能中。有没有一种简单的方法可以用python实现这一点?我有一个大的数据帧,我正试图将其转换为一个频率数据帧,用于特征选择
如果需要更多信息,我会更新我的帖子
将
pd.value_counts
与apply
一起使用:备选方案^{} 与^{}
Numpy
这个值就是速度。但显然更复杂
这将生成一个索引
i
,该索引将对应于我分配给j
的df
中的值。我将使用这些索引在由i
和j
中的索引指定的数组a
的位置添加一个索引相关问题 更多 >
编程相关推荐