我是数据科学的初学者,需要您的帮助。我正在尝试使用K-means进行无监督机器学习的测试,但发现结果并非球形。我已经进行了归一化处理,移除了异常值等。我尝试了多种方法来纠正这个问题,但都没有效果。
这是图片:(我从数据集中抽取了一个小样本给您看,实际上有8000行)
…
回答:
您的数据有6个维度。直接可视化超过2维的数据是不可能的,您需要使用PCA或TSNE来进行可视化。
我是数据科学的初学者,需要您的帮助。我正在尝试使用K-means进行无监督机器学习的测试,但发现结果并非球形。我已经进行了归一化处理,移除了异常值等。我尝试了多种方法来纠正这个问题,但都没有效果。
这是图片:(我从数据集中抽取了一个小样本给您看,实际上有8000行)
…
回答:
您的数据有6个维度。直接可视化超过2维的数据是不可能的,您需要使用PCA或TSNE来进行可视化。