我正在尝试学习如何对一个简单的数据集进行集群。 '太阳.csv'是一个只有2列数据的csv,我想通过python和pyclustering包来做一个集群模型 下面的代码显示错误“KeyError:0”
import pyclustering
import pandas as pd
# Read data 'SampleSimple3' from Simple Sample collection.
# sample = read_sample(SIMPLE_SAMPLES.SAMPLE_SIMPLE3)
sample = pd.read_csv('suns.csv')
kmedoids_instance = kmedoids(sample, [8, 23, 36, 50])
kmedoids_instance.process()
clusters = kmedoids_instance.get_clusters()
medoids = kmedoids_instance.get_medoids()
for i in range(len(clusters)):
medoid_point = sample[medoids[i]]
clusters[i] = sorted(clusters[i], key=lambda index: metric.euclidean_distance(medoid_point, sample[index]))
print(clusters[i])
print("\n")
我想让模型创建自己的集群组,并绘制模型
pd.read_csv('suns.csv')
返回DataFrame
或TextParser
。您必须将其转换为由内置的list
或numpy.array
表示的点列表,类似于[[1.0, 2.3], [1.3, 2.4], ...]
。你知道吗相关问题 更多 >
编程相关推荐