为了学习目的,我正在考虑从头开始实现一个完全链接聚类算法。我注意到与单链接相比有很大差异:
与单链接不同,完全链接方法可能会受到平局情况的强烈影响(即距离矩阵中存在两个具有相同距离值的组/簇的情况)。
我想看到一个发生这种情况的距离矩阵示例,并理解为什么会发生这种情况。
回答:
考虑一维数据集
1 2 3 4 5 6 7 8 9 10
根据你如何进行第一次合并,可以得到非常好或非常差的结果。例如,首先合并2-3,5-6和8-9。然后合并2-3-4和7-8-9。将其与大多数人会产生的“显而易见”的结果进行比较。