将分类数据转换为数值并保存为libsvm格式python

2024-09-27 20:17:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据帧,看起来像这样:

    A         B        C        D
1   String1   String2  String3  String4
2   String2   String3  String4  String5
3   String3   String4  String5  String6
.........................................

我的目标是将这个数据帧转换为libSVM格式。在

到目前为止,我所做的努力如下:

^{pr2}$

有没有办法把数据帧或csv文件转换成这种格式。或者,有没有更聪明的方法来实现转型?在

我尝试从这个存储库加载要执行this的脚本,如下所示:

%load libsvm2csv.py

脚本加载正确,但运行时:

libsvm2csv.py dataframe.csv dataframe.data 0 True

或者

libsvm2csv.py dataframe.csv dataframe.txt 0 True

我得到"SyntaxError: invalid syntax"指向数据帧.csv在


Tags: csv数据py脚本true目标dataframe格式
1条回答
网友
1楼 · 发布于 2024-09-27 20:17:59

在对数据进行预处理之后,您可以提取一个矩阵并使用scikit learnsdump_svmlight_file来创建这种格式。在

示例代码:

import pandas as pd
from sklearn.datasets import dump_svmlight_file

dummy = pd.get_dummies(dataframe)
mat = dummy.as_matrix()
dump_svmlight_file(mat, y, 'svm-output.libsvm')  # where is your y?

备注/备选方案:

你说的是libsvm2csv.py文件进行这种转换,但方向不对。它是libsvm格式->;csv。在

检查短语csv2libsvm.py如果您想从cvs->;libsvm转换(不使用scikit learn)。在

我更喜欢使用scikit learn(与phraug相比)

相关问题 更多 >

    热门问题