我试着做一个简单的k-均值,但是你可以选择簇的数量,我已经知道了如何得到每个中心之间的距离,但是从这里我需要比较一个点和所有其他质心之间的所有值,将每个点分配给一个质心。所以基本上我需要比较不同数量的列表值和不同数量的质心来标记它们。但是如何比较嵌套列表中数量可变的变量值,以便将它们标记为质心?你知道吗
data = genfromtxt('datafiler/data.csv', delimiter=',')
Centroids = np.array([[30, 70], [70, 30], [50, 50], [70, 70]])
k = input("Number of clusters:")
distList = []
for x in range(int(k)):
distList.append([])
for v in range(int(k)):
for i in range(len(data)):
dist = np.linalg.norm(Centroids[v]-data[i])
distList[v].append(dist)
目前没有回答
相关问题 更多 >
编程相关推荐