我想在部署K-means算法后,从每个聚类中获取基于欧几里得距离与中心最近的N个数据点。我能够通过以下方式获取数据点的索引:
np.where(km.labels_ == 0)
回答:
您可以使用kmeans
类的transform
方法,该方法计算每个数据点到每个聚类的距离。
然后,假设您想从第0个索引的cluster
中获取前N
个点,您可以这样做:
cluster = 0N = 2np.sort(kmeans.transform(X)[:,cluster])[:N]
我想在部署K-means算法后,从每个聚类中获取基于欧几里得距离与中心最近的N个数据点。我能够通过以下方式获取数据点的索引:
np.where(km.labels_ == 0)
回答:
您可以使用kmeans
类的transform
方法,该方法计算每个数据点到每个聚类的距离。
然后,假设您想从第0个索引的cluster
中获取前N
个点,您可以这样做:
cluster = 0N = 2np.sort(kmeans.transform(X)[:,cluster])[:N]