使用HDBSCAN检索群集成员

2024-09-30 19:32:26 发布

男 | 程序猿一只，喜欢编程写python代码。

所以我有一些字符串数据，我对其进行了一些操作，然后使用HDBSCAN创建了一个集群：

textData = train['eudexHash'].apply(lambda x: str(x))
clusterer = hdbscan.HDBSCAN(min_cluster_size=5,
                            gen_min_span_tree=True,
                            prediction_data=True).fit(textData.values.reshape(-1,1))

现在，当我使用近似_predict调用集群进行预测时，我得到以下结果：

>>>> hdbscan.approximate_predict(clusterer, testCase)
(array([113]), array([1.]))

Sweet，看起来它在预测新的情况，所以它认为新的字符串值对应于标签[113]。现在，我如何找到该标签/存储桶/集群中的其他成员

干杯

Tags：数据字符串 true 集群 train 标签 min array

1条回答

网友

1楼 · 发布于 2024-09-30 19:32:26

如果您想找出哪个训练数据是标签113的一部分，那么您可以这样做

textdata_with_label_113 = textData[clusterer.labels_ == 113]

使用HDBSCAN检索群集成员

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用HDBSCAN检索群集成员

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >