统计学、机器学习和数据挖掘

我目前正在学习数据挖掘,并且有以下几个问题。 机器学习…

单类支持向量机

我想确保我理解正确。首先,我是一名本科计算机工程专业的…

数据挖掘的基本查询

已关闭。此问题属于基于意见的。目前不接受回答。 想要改…

实现聚类使用的邻近矩阵

请原谅我在这领域还比较新手,如果我的问题听起来很简单或…

使用频繁项集挖掘构建关联规则?

我对这个领域以及相关术语都很陌生,所以如果我说得不对,…

给定一个包含大量URL的列表,将这些URL按模式或正则表达式分组的最佳数据挖掘方法是什么?

我有一百万个URL的列表,我想将相似的URL聚类在一起…

在Matlab中对缺失数据进行期望最大化

我需要使用EM算法来估计两个类别的高斯分布的均值和协方…

决策树如何计算分割属性?

当我们使用任何决策树算法,并且我们的数据集包含数值时。…

我想要用于样本实验的预测/预报算法列表

很难理解这里问的是什么。这个问题含糊不清、模糊、不完整…

.NET机器学习库,类似于Apache Mahout的类比

已关闭。 此问题不符合Stack Overflow 指…

在给定文本中发现“模板”?

如果我有大量的文本,并且试图发现其中最常出现的模板,我…

潜在 Dirichlet 分配与文档聚类的关系

我想澄清潜在 Dirichlet 分配(LDA)与文档…

不知道聚类数量的情况下使用Kmeans? [duplicate]

这个问题已经有了答案: 如何在使用k-means聚类时…

将概念上相似的文档聚类在一起?

这更像是一个概念性的问题,而不是实际的实现,希望有人能…

Python实现OPTICS(聚类)算法

我正在寻找一个在Python中实现的OPTICS算法的…

使用标签对文档进行分类

我有大量的文档(主要是PDF和DOC格式),我想对它们…

使用PyLucene作为K-NN分类器

我有一个包含数百万个样本的数据集,每个样本包含128个…

通用序列模式发现的库/框架?

已关闭。 此问题正在寻求关于软件库、教程、工具、书籍或…

结构化文本和非结构化文本

关于数据挖掘,结构化文本和非结构化文本之间有哪些区别?…

Rapid miner: 导入使用逗号而非小数点的实数CSV文件

我在使用RapidMiner导入CSV文件时遇到了问题…

如何推导出一种模式

我想推导出一种模式,用来判断门应该何时打开,何时关闭。…

最简单的特征选择算法

我正在尝试创建自己的简单特征选择算法。我将要处理的数据…

Web Mining Via Search Engines

我在用谷歌地图找公寓,把各种房源信息复制到电子表格中,…

可扩展的分类器用于查找缺失属性

我有一个大型稀疏矩阵,代表数百万实体的属性。例如,一个…

概率生成语义网络

我研究了一些简单的语义网络实现和解析自然语言的基本技术…