我的数据格式如下:
X,Y,sim(X,Y)
也就是说,这是一组三元组列表,其中包括:
- X,一个对象的名称;
- Y,另一个对象的名称;
- sim(X,Y),表示两个对象之间距离的实数。
现在,我想对这些数据应用一些无监督聚类算法。我考虑使用Weka,但也乐意考虑其他替代方案。
回答:
有很多算法可以处理相似性矩阵:
- 层次连接聚类
- DBSCAN
- OPTICS
- 亲和传播
- 谱聚类
这里仅列举几种。至于软件,我更喜欢ELKI,它提供了更多的聚类选择。
我的数据格式如下:
X,Y,sim(X,Y)
也就是说,这是一组三元组列表,其中包括:
现在,我想对这些数据应用一些无监督聚类算法。我考虑使用Weka,但也乐意考虑其他替代方案。
回答:
有很多算法可以处理相似性矩阵:
这里仅列举几种。至于软件,我更喜欢ELKI,它提供了更多的聚类选择。