从scikitlearn/numpy中的群集中心计算标签？

def compute_labels(centers,datapoints): ans=[] for point in datapoints: ans.append( min( ((i,np.linalg.norm(point-center)) for i,center in enumerate(centers)), key=lambda t:t[1] )[0] ) return ans

from sklearn.cluster import KMeans import numpy as np np.random.seed(42) datapoints1=np.random.rand(200,38) datapoints2=np.random.rand(200,38) kmeans1=KMeans( init="k-means++", random_state=42, n_init=100 ) kmeans1=kmeans1.fit(datapoints1) kmeans2=KMeans( init=kmeans1.cluster_centers_, max_iter=1, n_init=1 ) kmeans2.predict(datapoints2) print((kmeans1.cluster_centers_==kmeans2.cluster_centers_).all())

2条回答

网友
1楼 · 编辑于 2024-10-03 23:24:02

sklearn正在检查一个名为check_is_fitted的函数，该函数正在查看模型的属性。在您的例子中，由于您从未调用过fit，因此某些属性不存在，这会触发错误。您可以通过手动创建它们来伪造它，例如：
from sklearn.cluster import KMeans import numpy as np np.random.seed(42) datapoints1=np.random.rand(200,38) datapoints2=np.random.rand(200,38) kmeans1=KMeans( init="k-means++", random_state=42, n_init=100 ) kmeans1=kmeans1.fit(datapoints1) kmeans2=KMeans( init=kmeans1.cluster_centers_, max_iter=1, n_init=1 ) kmeans2.cluster_centers_ = kmeans1.cluster_centers_ # you have it kmeans2.labels_ = kmeans1.labels_ # to test if required, no difference found print([v for v in vars(kmeans2) if v.endswith("_") and not v.startswith("__")]) # if this list is empty, the model if not fitted, you can compare it to kmeans1 pred = kmeans2.predict(datapoints2) print(pred) # [3 7 1 ... 2] print((kmeans1.cluster_centers_== kmeans2.cluster_centers_).all()) # True

网友
2楼 · 编辑于 2024-10-03 23:24:02

只是对Nicolas M. answer的一个补充
广义函数（带有虚拟静态变量）：
def compute_labels(centers,datapoints): compute_labels.dummy.cluster_centers_=centers return compute_labels.dummy.predict(datapoints) compute_labels.dummy=KMeans()

相关问题更多 >

编程相关推荐

热门问题

热门文章