我有一个DataFrame X,包含列A、B和C。我对其应用了kMeans聚类,设置n_clusters=4,并获取了每个聚类中心10个最近数据点的欧几里得距离。例如,对于第i个聚类,我这样做了:
#获取第i个聚类中心的10个最近点print(np.sort(kmeans.transform(X)[:, i])[: 10])#输出:-array([0.06096257, 0.07785726, 0.09155965, 0.09301038, 0.09741242, 0.1016601 , 0.10242911, 0.10314227, 0.10775149, 0.10895064])
现在,我想获取这10个数据点的特征A、B和C。该如何实现呢?
回答:
如果你想获取最小值的索引,可以使用argsort。
将距离映射到点是复杂的。