随机森林在大数据集上的应用

我在R中有一个大型数据集(超过100万行,6列),我想…

专注的命名实体识别(NER)?

我想在特定领域(例如棒球)中识别命名实体。我知道有像S…

逻辑谬误检测和/或识别与自然语言处理

是否存在用于检测文本中逻辑错误论证的软件包或方法? 我…

### Adaboost算法的基本理解

我是一个机器学习的新手,正在尝试理解Adaboost的…

使用Adaboost选择特征向量中的最佳特征

我阅读了一些关于Adaboost如何工作的文档,但对此…

朴素贝叶斯分类法的简单解释

已关闭。 此问题不符合 Stack Overflow …

文本分类中的命名实体作为特征?

在现有的文本分类(监督学习)技术中,为什么我们不将文本…

在重复检测算法中组合独立分数以生成总分

我正在构建一个重复检测器,并且已经确定了一些与重复相关…

FFT与音乐比较

我在尝试使用一些音乐聚类算法进行实验,我认为使用一个主…

机器学习中PCA或SVD的重要性

一直以来(特别是在Netflix竞赛中),我经常看到这…

单个感知器 – 非线性评估函数

在单个感知器的情况下,文献指出它无法用于分离非线性判别…

Hadoop 或 Postgresql 用于有效处理

我是一名学生,正在尝试对一个大型数据集使用一些机器学习…

关于机器学习/计算机视觉领域的实践方法问题

我对机器学习、数据挖掘和计算机视觉领域充满热情,并且我…

openCV中的SVM抛出”cv::Exception at memory location”

我正在尝试使用SVM、openCV、C++和Visua…

使用Weka进行文本分类

我在Java中使用Weka库构建一个文本分类器。 首先…

Python scikits SVM网格搜索和分类

我是scikits和SVM的新手,想请教几个问题。我有…

通用机器学习算法,训练集 -> “预测器”

很难判断这里问的是什么。这个问题含糊不清、模糊、不完整…

Amazon EC2 vs PiCloud

已关闭。此问题属于基于意见的问题。目前不接受回答。 想…

使用反向传播训练前馈神经网络

我在训练我的神经网络时遇到了一些困难。当我使用,比如说…

如何在自然文本中查找日期引用?

我想做的就是解析原始的自然文本,并找出所有描述日期的短…

使用Python的朴素贝叶斯分类器

我使用scikit-learn来计算文档的Tf-idf…

在Mahout中查找特征向量中不相似的维度

如果我使用基于相似性的算法,比如皮尔逊相关系数,来比较…

聚类算法性能分析

我有两组数据集,想使用KNIME对这些数据集进行聚类分…

在Weka中创建测试集

假设我有一个以如下形式编写的ARFF文件: @rela…

weka mac 安装

最近,我买了一台新的MacBook并安装了Weka。当…