Davies-bouldin指数验证本质上是簇内散布与簇间距离的比率。我们对所有簇进行迭代,最终取maximum
(最大值)。我的问题是,为什么选择最大值而不是最小值?
谢谢你。
回答:
考虑以下场景:
有三个簇。一个簇与其他簇分离得很好,另外两个簇混杂在一起。
假设所有簇的S_i都为0.5。
对于混杂的簇,M_ij接近于零。对于分离良好的簇,均值之间的距离要大得多。结果是,混杂簇的R_i值较大,而分离簇的R_i值较小。
如果你取最大值,指数会说“有两个簇混在一起,结果因此不好——并非所有簇都分离得很好”。如果你使用最小值,它会忽略这个问题并说“至少它与一个其他簇分开了”。