Python, Scikit-learn, K-means: 参数 n_init 到底有什么作用？ [duplicate]

我是 Python 的初学者。现在，我正在尝试理解来自 sklearn.cluster.KMeans 的参数 n_init 的作用。

根据文档：

n_init : int, 默认值: 10

K-means 算法运行的次数，每次使用不同的质心种子。最终结果将是 n_init 次连续运行中惯性最佳的输出。

起初，我以为它表示代码运行的次数，直到我发现了这个有用的问题，我才意识到这是 max_iter 的作用。

参数 n_init 到底有什么作用？我真的不明白。

回答：

在 K-means 中，质心的初始位置对其收敛起着非常重要的作用。有时候，初始质心放置的方式使得在 K-means 的连续迭代中，聚类会发生剧烈的变化，甚至在达到收敛条件之前，max_iter 就已经达到，我们得到的聚类可能是不正确的。因此，这样得到的聚类可能是不正确的。为了克服这个问题，引入了这个参数。n_iter 的值基本上决定了算法应该使用多少组随机选择的质心。对于每一组不同的点，会比较聚类移动了多少距离，即如果聚类移动的距离较小，那么我们很可能接近真实/最佳解决方案。提供最佳性能的点及其相应的运行以及所有聚类标签将被返回。

如果你有兴趣，你也可以查看专门处理这个问题的 k-means++ 算法。

你还可以查看这个链接了解更多关于初始质心重要性的细节。

学技术

Python, Scikit-learn, K-means: 参数 n_init 到底有什么作用？ [duplicate]

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复