"使用scikit-learn进行二元数据集的分类方法"

2024-09-28 22:02:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我有以下二进制数据集:

[
    [1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1],
    [1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1],
    [1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 0, 1, 0],
    [1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0],
    [1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0]
]

我想把它分成3个部分,以使最相似的数组(数组中相同位置的0和1)聚集在同一组中。在

因为我了解到二进制数据不能直接聚集在一起,需要降低维数。manifold learning algorithms可以这样做。我试图把它缩小到2维,然后把它分散在一个图上,使它更加用户友好,多维缩放似乎是这样做的most promising algorithm。但是,当我在数据集周围进行调整时,它仍然返回相同的数据集,而不进行任何缩减:

^{pr2}$

你知道我做错什么了吗?我试图将这个数据集简化为二维,然后将其聚集在二维散点图上,这样相似的数组就可以紧密地基于0和1位置的相似性分组在一起


Tags: 数据用户most二进制数组相似性algorithmlearning
1条回答
网友
1楼 · 发布于 2024-09-28 22:02:07

fit()只学习数据,不会以任何方式更改它。您需要调用fit_transform()来获取新的转换数据。像这样:

newX = mds.fit_transform(X)

newX将是包含2个组件的数据。在

相关问题 更多 >