在使用高斯混合模型之前进行特征缩放是否重要?为什么在获取聚类参数(均值和协方差矩阵)时使用概率会变得重要?另一方面,我知道在使用K-means进行聚类之前标准化数据很重要,因为这里的聚类依赖于点与聚类之间的欧几里得距离,如果某个特征的值很大,它会主导这种多维距离的计算。
回答:
在高斯混合建模中,你会了解到聚类的范围和规模。因此,理论上,缩放应该不会产生任何影响。你只是会在之后得到不同比例的协方差矩阵。
在使用高斯混合模型之前进行特征缩放是否重要?为什么在获取聚类参数(均值和协方差矩阵)时使用概率会变得重要?另一方面,我知道在使用K-means进行聚类之前标准化数据很重要,因为这里的聚类依赖于点与聚类之间的欧几里得距离,如果某个特征的值很大,它会主导这种多维距离的计算。
回答:
在高斯混合建模中,你会了解到聚类的范围和规模。因此,理论上,缩放应该不会产生任何影响。你只是会在之后得到不同比例的协方差矩阵。