当其中一个向量全为零时的余弦相似度

如何表达余弦相似度( http://en.wikipe…

将ExampleSet设置为ExampleSet2SimilarityExampleSet Rapidminer操作符与Java

我创建了一个测量相似度的流程。我使用了ExampleS…

为什么F-Measure是精确率和召回率的调和平均数而不是算术平均数?

当我们计算F-Measure时,同时考虑了精确率和召回…

在CRF模型中可以使用数值特征吗

在CRF模型中添加数值特征是否可行或有益?例如,序列中…

有人能提供一个监督学习和无监督学习的现实生活中的例子吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

增强期望最大化算法的性能

我正在用C++实现期望最大化(EM)算法来估计高斯混合…

scikit-learn: 使用DBSCAN聚类文本文档

我正在尝试使用scikit-learn来聚类文本文档。…

异常检测 – 使用什么工具

用于异常检测的系统应该使用什么? 我注意到像Mahou…

下载大丰超市数据集的链接

已关闭。 此问题正在寻求关于软件库、教程、工具、书籍或…

用于比较期望最大化算法时间性能的框架

我基于这篇论文实现了自己的期望最大化(EM)算法,并希…

训练集中未见但在测试集中出现的特征向量值

我有一个数据集,其中包含一个关于对某人称呼的特征向量,…

如何在n维空间中计算期望最大化算法的方差?

我在研究论文中回顾了期望最大化(EM)算法,例如这篇论…

无法运行PHP::SVM

我尝试运行官方PHP::SVM教程中的一个基本SVM …

从Twitter数据中追踪飓风路径

我正在尝试从Twitter数据中追踪飓风桑迪的实际移动…

最佳聚类数量在R中

在关于如何选择聚类数量的Stack Overflow回…

聚类Twitter信息流

我对聚类技术还不太熟悉,之前只实现过几个算法。我需要根…

为什么我们可以用熵来衡量语言模型的质量?

已关闭。此问题属于基于意见的。目前不接受回答。 想要改…

使用mcl可以调整哪些参数?

我在使用mcl对无向图进行聚类。为此,我选择了一个阈值…

大数据与数据挖掘有什么区别?

已关闭。此问题属于基于意见的问题。目前不接受回答。 想…

如何使用时间序列数据集创建单一值?

我有以下数据集(共265个数据集)。这是一个每秒记录一…

在R中如何设置Kohonen SOM的聚类数量?

我有一组数据,想用R中的Kohonen SOM进行聚类…

数据挖掘项目指南

我正在为我的课程进行一个数据挖掘项目,我想听听专家的意…

何时应用数据白化

数据白化(特征缩放和均值归一化)在我们使用代表不同特征…

如何使用WEKA API获取”平均相对区域大小”

我在Java代码中使用WEKA API来自定义生成的训…

什么使得k-medoid中的距离度量比k-means“更好”?

我正在阅读关于k-means聚类和k-medoid聚类…