我有一个包含(已标记)聚类的数据集。我试图找到每个聚类的中心点(一个与聚类中所有数据点距离最小的向量)。
我找到了许多先进行聚类然后再查找中心点的解决方案,但对于已存在的聚类我还没有找到合适的方案。
首选Python的Scikit-learn。谢谢。
回答:
直接来自文档:
from sklearn.neighbors.nearest_centroid import NearestCentroidimport numpy as npX = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])y = np.array([1, 1, 1, 2, 2, 2])clf = NearestCentroid()clf.fit(X, y)print(clf.centroids_)# [[-2. -1.33333333]# [ 2. 1.33333333]]