使用Jaccard系数构建相似性矩阵进行谱聚类

我有一个分类数据集,我正在对其进行谱聚类。但是我得到的输出并不是很好。我选择了对应于最大特征值的特征向量作为k-means的中心点。

请查看我遵循的过程如下:

1. 使用Jaccard系数创建一个对称的相似性矩阵(m*m)。例如,对于一个数据集,a,b,c,d和a,b,x,y,我计算的相似性矩阵看起来像:|1       0.33| |0.33     1  |2. 计算对应于最大特征值的前k个特征向量,其中k是聚类的数量。3. 归一化对称的相似性矩阵4. 使用特征向量作为k-means的初始中心点,对归一化的相似性矩阵进行聚类。

我的问题是:

计算Jaccard相似性矩阵是否是谱聚类的正确选择。选择特征向量作为谱聚类的聚类中心点是否正确,因为对于分类数据集我没有看到其他选项。我遵循的程序是否有任何错误。

回答:

据我所知,你混合和打乱了多种方法。难怪它不起作用…

  1. 你可以简单地使用Jaccard距离(Jaccard相似性的简单倒数)+ 层次聚类
  2. 你可以使用MDS来投影你的数据,然后进行k-means(可能是你试图做的事情)
  3. 亲和传播等方法也值得一试

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注