我所见过的Python中实现的分层聚类方法(如scipy, scikit-learn等)每次都是分裂或合并两个聚类。这使得每个节点的分支因子固定为2。为了我的需求,我希望模型允许分支因子大于2。在聚类之间存在平局的情况下,这会非常有帮助。
我并不熟悉任何分支因子大于2的分层聚类技术;这样的技术存在吗?
回答:
使用单链接聚类这个数据集:
0 00 11 01 1
你将会看到一个四向合并。
但是对于其他链接方式,总是寻找最佳的三向分裂可能会将运行时间成本增加到O(n^4)。你真的不希望这样。