DBSCAN使用metric='russellrao'

2024-10-03 13:24:51 发布

男 | 程序猿一只，喜欢编程写python代码。

我使用时遇到了一个问题sklearn.cluster.DBSCAN. 如果我使用DBSCAN(metric="russellrao")，应该使用哪种数据格式？我尝试了两种方法，都返回pred = [-1 -1 -1 ..., -1 -1 -1]。您可以看到下面的2种数据格式。你知道吗

npy = df2.values
y_pred = DBSCAN(metric="russellrao").fit_predict(npy)

1。 npy= enter image description here

2。 npy= enter image description here

打印y\ U pred [-1-1-1…，-1-1-1]

那么，哪种格式是正确的？你知道吗

Tags：方法格式 sklearn metric predict dbscan fit values

1条回答

网友

1楼 · 发布于 2024-10-03 13:24:51

您需要适当地选择其他DBSCAN参数。你知道吗

IMHO，sklearn应该而不是为它们设置默认值。尤其是epsilon在很大程度上取决于您的数据集和度量，因此默认值几乎总是一个错误的选择。它应该强制用户选择参数，而不是提供错误的默认值。你知道吗