使用准备好的数据进行Scikit分类

1条回答

网友

1楼 · 发布于 2024-09-30 18:14:45

所需的数据是一个^{} array（在本例中为“矩阵”），形状为(n_samples, n_features)。在

使用^{}将csv-file读入正确格式的简单方法。另请参考this thread。在

让csv文件的内容（比如当前工作目录中的file.csv）为：

a,b,c,target
1,1,1,0
1,0,1,0
1,1,0,1
0,0,1,1
0,1,1,0

我们需要加载它

^{pr2}$

将skip_header设置为True，以防止读取标题列（a,b,c,target行）。有关详细信息，请参阅numpy's documentation。在

加载数据后，需要根据输入数据格式进行一些预处理。预处理可以类似于分割输入和目标（分类）或将整个数据集拆分为训练和验证集（用于交叉验证）。在

为了将输入（特征矩阵）与输出（目标向量）分开，我们需要

features = data[:, :3]
targets = data[:, 3]   # The last column is identified as the target

对于上述给定的CSV数据，数组将使用如下所示：

features = array([[ 0, 1, 0],
              [ 1, 1, 0],
              [ 0, 1, 1],
              [ 0, 0, 0]])  # shape = ( 4, 3)

targets = array([ 1, 1, 1, 0])  # shape = ( 4, )

现在这些矩阵被传递给估计器对象fit函数。如果你使用的是流行的支持向量机分类器，那么

>>> from sklearn.svm import LinearSVC
>>> linear_svc_model = LinearSVC()
>>> linear_svc_model.fit(X=features, y=targets)

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用准备好的数据进行Scikit分类

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >