使用HDBSCAN检索群集成员

2024-09-30 19:32:26 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我有一些字符串数据,我对其进行了一些操作,然后使用HDBSCAN创建了一个集群:

textData = train['eudexHash'].apply(lambda x: str(x))
clusterer = hdbscan.HDBSCAN(min_cluster_size=5,
                            gen_min_span_tree=True,
                            prediction_data=True).fit(textData.values.reshape(-1,1))

现在,当我使用近似_predict调用集群进行预测时,我得到以下结果:

>>>> hdbscan.approximate_predict(clusterer, testCase)
(array([113]), array([1.]))

Sweet,看起来它在预测新的情况,所以它认为新的字符串值对应于标签[113]。现在,我如何找到该标签/存储桶/集群中的其他成员

干杯


Tags: 数据字符串true集群train标签minarray