从不同来源粘贴代码时RF预测的差异

我正在玩弄“caret”包中的德国信贷数据集。 首先,…

在处理高基数数据的预处理中,是先进行哈希处理还是先进行独热编码?

哈希处理可以降低维度,而独热编码则通过将多类别变量转换…

scikit-learn, LinearSVC – 如何从训练后的SVM中获取支持向量?

我正在使用scikit-learn库中的LinearS…

使用训练好的高斯混合模型标记新数据

我不确定如何使用训练好的高斯混合模型(GMM)对新数据…

将带有名字的相似图像分组

我有数百张需要分组的图像。这些图像中都包含名字和颜色。…

机器学习 – 感知器

假设有两个感知器在同一个线性可分分布的无限样本上运行。…

朴素贝叶斯分类中的未知词

如何测试包含未知词的文本分类问题?在训练模型时,我们可…

如何使用Pattern对西班牙语单词进行词形还原?

我想对一组评论进行词形还原。据我所知,nltk无法对英…

多类分类中的留一法准确率

我对如何在多类别、一对其余分类的情况下使用留一法(LO…

如何为使用1-of-k编码的多类别逻辑回归分类器导出目标函数?

我理解这个维基页面所说的内容(http://en.wi…

如何使用nltk对西班牙语单词列表进行词干提取?

如何使用nltk的SnowballStemmer对以下…

为什么自然语言处理和机器学习社区对深度学习感兴趣?

为什么自然语言处理和机器学习社区对深度学习表现出浓厚的…

使用现有的人工翻译来辅助机器翻译到新语言

过去,我的公司使用专业的人工翻译人员将我们的软件从英语…

如何在R中导出gbm模型?

在R中导出gbm模型是否有标准(或可用的)方法?PMM…

NLP项目:社交媒体评论摘要

我计划在最后一年做一个关于自然语言处理(使用NLTK)…

如何设置我的输入神经元以接收我的输入

我需要能够判断一个形状是正确还是错误地绘制, 我有形状…

在Scikit中选择特征和使用K均值恢复特征

我想在Scikit中进行K均值聚类。我有9个特征,但我…

贝叶斯分类,来自《Clojure For Machine Learning》的示例

我目前正在学习贝叶斯分类的算法,当我试图按照书中的示例…

如何在使用Matlab的svmtrain获得模型后找到特征的权重?

目前,模型返回的结构类型模型具有以下属性: 支持向量 …

为什么F-Measure是精确率和召回率的调和平均数而不是算术平均数?

当我们计算F-Measure时,同时考虑了精确率和召回…

主题和潜在 Dirichlet 分配

潜在 Dirichlet 分配(LDA)是一种生成模型…

K-Means on MongoDB

我想在MongoDB中使用K-Means算法查询一个集…

根据姓名分类性别(以及可能的年龄范围)

在尝试将数据集(以CSV格式)上传到H2O时,我发现F…

避免在逻辑压缩函数中出现无穷大

我在实现逻辑回归函数的一部分时,总是得到-inf的结果…

使用训练好的分类器文件与Weka

我在过去几天一直在研究svmlight分类器。我有一个…