绘制新文档以散布p - 问答 - Python中文网

绘制新文档以散布p

2024-07-07 06:13:01 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我希望对我的数据有所了解。我使用sklearn PCA将它们转换成VSM，并将它们绘制成matplotlib图。这包括

使用管道将文档转换为数字矩阵

test = pipeline.fit_transform(docs).todense()

适合我的模型
```
pca = PCA().fit(test)
```
然后我用transform转换它
```
    data = pca.transform(test)
```

最后，我使用Matplotlib绘制结果

   plt.scatter(data[:,0], data[:,1], c = categories)

我的问题是：我该如何选择新的句子，并确定它们相对于其他文件的位置。用X来标记它们的相对位置？你知道吗

谢谢

Tags：数据文档 test data 管道 matplotlib 绘制 transform

1条回答

网友

1楼 · 发布于 2024-07-07 06:13:01

还将新文档强制转换为数字数组
```
new = pipeline.transform(new_docs).todense()
```
请注意，这将使用带有先前拟合参数的pipeline，因此它是pipeline.transform，而不是pipeline.fit_transform。
使用先前拟合的pca转换新数据。你知道吗
```
new_data = pca.transform(new)
```
这会将新数据转换为与原始数据相同的PC空间。

使用第二个scatter将新数据添加到绘图中。你知道吗

plt.scatter(data[:,0], data[:,1], c = categories)
plt.scatter(new_data[:,0], new_data[:,1], marker = 'x')
plt.show()

相关问题更多 >

编程相关推荐

热门问题

热门文章