我正在寻找一个理想上具有以下功能的库:
- 实现多维数据的层次聚类(理想情况下基于相似性或距离矩阵)
- 实现支持向量机
- 使用C++编写
- 有一定的文档(这似乎是最难的)
我希望这个库是用C++编写的,因为我对这种语言最熟悉,但如果库值得,我也会使用其他语言。我已经通过谷歌搜索找到了一些,但没有时间一一尝试,所以我想听听其他人对这些库的使用经验。请仅在您对推荐的库有使用经验时回答。
附注:我也可以为聚类和SVM使用不同的库。
回答:
为了完整起见,我将发布我最终选择的方案。我现在使用scipy-cluster来进行聚类部分。这是迄今为止我发现的最通用的实现。我认为我会选择libSVM(现在有Python接口)来进行SVM部分。我选择Python是因为实在找不到适合的C++层次聚类实现(C Clustering Library专门用于微阵列,不支持多维数据)。