我用Pypsark创建了一个kmeans算法。现在,我还要提取集群中心。我如何将其包括在管道中?这是到目前为止我所拥有的代码,但它向我抛出了一个错误'AttributeError:'PipelineModel'对象没有属性'ClusterCenter'。怎么能修好呢
#### model K-Means ###
from pyspark.ml.clustering import KMeans, KMeansModel
kmeans = KMeans() \
.setK(3) \
.setFeaturesCol("scaledFeatures")\
.setPredictionCol("cluster")
# Chain indexer and tree in a Pipeline
pipeline = Pipeline(stages=[kmeans])
model = pipeline.fit(matrix_normalized)
cluster = model.transform(matrix_normalized)
#get cluster centers
centers = model.clusterCenters()
虚拟数据
你的代码
换最后一行就行了
相关问题 更多 >
编程相关推荐