绘制新文档以散布p

2024-07-07 06:13:01 发布

您现在位置:Python中文网/ 问答频道 /正文

我希望对我的数据有所了解。我使用sklearn PCA将它们转换成VSM,并将它们绘制成matplotlib图。这包括

  1. 使用管道将文档转换为数字矩阵

    test = pipeline.fit_transform(docs).todense()
    
  2. 适合我的模型

    pca = PCA().fit(test)
    
  3. 然后我用transform转换它

        data = pca.transform(test)
    
  4. 最后,我使用Matplotlib绘制结果

       plt.scatter(data[:,0], data[:,1], c = categories)
    

我的问题是:我该如何选择新的句子,并确定它们相对于其他文件的位置。用X来标记它们的相对位置?你知道吗

谢谢


Tags: 数据文档testdata管道matplotlib绘制transform
1条回答
网友
1楼 · 发布于 2024-07-07 06:13:01
  1. 还将新文档强制转换为数字数组

    new = pipeline.transform(new_docs).todense()
    

    请注意,这将使用带有先前拟合参数的pipeline,因此它是pipeline.transform,而不是pipeline.fit_transform

  2. 使用先前拟合的pca转换新数据。你知道吗

    new_data = pca.transform(new)
    

    这会将新数据转换为与原始数据相同的PC空间。

  3. 使用第二个scatter将新数据添加到绘图中。你知道吗

    plt.scatter(data[:,0], data[:,1], c = categories)
    plt.scatter(new_data[:,0], new_data[:,1], marker = 'x')
    plt.show()
    

相关问题 更多 >