使用Stanford Parser解析杂乱文本

我正在使用Stanford Parser处理一大块文本…

理解集成学习及其在Matlab中的实现

集成学习是否是指多个特定分类器的实例,例如决策树分类器…

机器学习算法的困惑

我使用机器学习制作了一个关于板球预测的小应用。我收集了…

最佳聚类数量在R中

在关于如何选择聚类数量的Stack Overflow回…

如何运行和解释scikit-learn中的Fisher线性判别分析

我正在尝试运行Fisher的LDA(1, 2)来减少矩…

RPART – 特征类型

RPART 对连续变量、有序变量和分类变量使用不同的分…

如何使用scikit-learn的PCA进行特征降维并了解哪些特征被丢弃

我正在尝试对一个维度为m x n的矩阵进行PCA,其中…

libsvm – 训练信号

我刚开始接触机器学习和支持向量机等领域。我有一组信号的…

如何计算Scikit learn中的R2值?

scikit learn返回的R^2值(metrics…

如何使用监督机器学习方法处理不同维度的输入?

我目前正在处理训练和测试数据集(一组数组),这些数组的…

Mahout推荐系统中基于物品的推荐算法相似性策略的区别

我在使用Mahout的基于物品的推荐算法。所有可用的&…

无监督字符串聚类

我有一份包含1000多个关键词的列表,希望根据相似性将…

OpenCV Haar分类器 – 它是SVM吗?

我在工作中使用OpenCV Haar分类器,但一直看到…

什么是这种NLP符号的含义?

我正在学习NLP,试图在一个语料库上进行关系提取。我找…

如何量化这些特征以便使用逻辑回归进行分析?

我有一个困扰我一段时间的小问题。我有一个包含有趣特征的…

在二元分类中,为什么我们只从输入映射到特征空间?

我正在学习这些关于自然语言处理和机器学习的幻灯片。在第…

如何使用scikit-learn预测网站点击量变化率

我想使用变化率来预测网站的点击量变化。例如,如果一个网…

回归错误模型类型在R中使用Naive Bayes进行10折交叉验证

我正在对具有2个类别(0和1)的测试数据实施Naive…

Transductive SVM与Scikit-Learn

我在这里看到一个回答: 如果你只有少量标记数据但有很多…

使用RBF核SVM时,c或gamma的高值是否会引起问题?

我在使用WEKA/LibSVM训练一个术语提取系统的分…

使用已知分布对点进行分类

我的问题如下: 我得到了同一组数据集的多个卡方值,这些…

简单统计是/否分类器在WEKA中

为了比较我在标记文本分类研究中的结果,我需要一个基准进…

滑动窗口对象检测

我正在尝试使用滑动窗口技术来验证我的假设。我使用的是6…

处理大型(GB级)文件的快速多次处理(Java)

处理大型文件时,有哪些快速多次处理的选项? 我有一个单…

在NLP/概率/机器学习符号中:字母上方的波浪线表示什么?

我正在阅读这篇论文。在第1.1节中,作者提到: 字母上…