我使用时遇到了一个问题sklearn.cluster.DBSCAN.
如果我使用DBSCAN(metric="russellrao")
,应该使用哪种数据格式?
我尝试了两种方法,都返回pred = [-1 -1 -1 ..., -1 -1 -1]
。您可以看到下面的2种数据格式。你知道吗
npy = df2.values
y_pred = DBSCAN(metric="russellrao").fit_predict(npy)
1。 npy=
2。 npy=
打印y\ U pred [-1-1-1…,-1-1-1]
那么,哪种格式是正确的?你知道吗
您需要适当地选择其他DBSCAN参数。你知道吗
IMHO,sklearn应该而不是为它们设置默认值。尤其是epsilon在很大程度上取决于您的数据集和度量,因此默认值几乎总是一个错误的选择。它应该强制用户选择参数,而不是提供错误的默认值。你知道吗
相关问题 更多 >
编程相关推荐