我对K-medoids的理解是,中心点是从现有点中随机选取的。通过将剩余点分配到最近的中心点来计算聚类。计算误差(绝对距离)。
a) 新中心点是如何选取的?从示例来看,它们似乎是随机选取的?然后再次计算误差,看这些新中心点是更好还是更差。
b) 你如何知道需要停止选取新中心点?
回答:
值得阅读维基百科页面来了解k-medoid算法。你关于第一步从n
个数据点中随机选择k
个中心点的说法是正确的。
新中心点是通过在一个循环中交换每个中心点m
和每个非中心点o
,然后重新计算距离来选取的。如果成本增加,则撤销交换。
如果在完整的一轮中没有交换,算法就会停止。