使用KMeans时,每个质心获得超过2个坐标

我是机器学习的新手,我使用

from sklearn import datasetsiris=datasets.load_iris()

来学习KMeans。因此,我使用如下方式拟合数据:

kmeans=KMeans(n_clusters=1,random_state=42).fit(iris['data'])print(kmeans.cluster_centers_)

结果我发现,我得到了4个坐标而不是2个

[[5.84333333 3.05733333 3.758 1.19933333]]

我查阅了这篇文章来学习KMeans,但这篇文章也仅展示了两个坐标的例子

问题

为什么我得到了4个坐标而不是2个?我哪里做错了?我遗漏了什么?


回答:

Iris数据集包含描述三种不同类型花朵(即3个类别)的4个特征。因此,数据集中每个点都位于一个4维空间中,质心也是如此,因此要描述它们的位置需要4个坐标。

在例子中,使用二维数据(有时是三维)更容易,因为这样更容易绘图和展示用于教学目的,但质心将具有与数据维度(即特征)一样多的坐标,因此对于Iris数据集,你会期望得到4个坐标。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注