我有一个DataFrame X
,包含列A
、B
和C
。我对其应用了kMeans
聚类,设置n_clusters
=4,并获取了每个聚类中心10个最近数据点的欧几里得距离
。例如,对于第i
个聚类,我这样做了:
#获取第i个聚类中心的10个最近点print(np.sort(kmeans.transform(X)[:, i])[: 10])#输出:-array([0.06096257, 0.07785726, 0.09155965, 0.09301038, 0.09741242, 0.1016601 , 0.10242911, 0.10314227, 0.10775149, 0.10895064])
现在,我想获取这10个数据点的特征A
、B
和C
。该如何实现呢?
回答:
如果你想获取最小值的索引
,可以使用argsort
。
将距离映射到点是复杂的。