在径向基函数网络(RBF网络)中,隐藏层中的所有原型(RBF函数的中心向量)都是被选择的。这一步骤可以通过多种方式进行:
- 中心可以从一些示例集中随机抽样。
- 或者,可以使用k均值聚类来确定。
智能选择原型的一种方法是在我们的训练集上进行k均值聚类,并使用聚类中心作为原型。我们都知道k均值聚类以其简单性(速度快)为特点,但精确度不高。
这就是为什么我想知道是否有比k均值聚类更精确的其他方法?
任何帮助将不胜感激。
回答:
存在多种k均值变体:k中值、基于中位数的分区、模糊C均值聚类、使用期望最大化算法训练的高斯混合模型、k-means++等。
当我的数据集中包含一些“异常值”(与其他值差异很大的噪声数据)且我不希望中心受这些数据影响时,我使用基于中位数的分区(PAM)来提高精确度。在PAM中,中心被称为中位数。