scikit learn对停用词进行分类

以下是一个逐步指导系统学习和分类输入数据的示例。 它能…

随机森林的混合预测变量类型

我正在尝试使用随机森林为一个包含5个预测变量的数据集构…

我的混淆矩阵实现是否正确?还是其他地方出了问题?

我训练了一个具有5个类别的多类别SVM分类器,即svm…

机器学习用于判断奇偶数的两个不同分类器的正确/错误输出

我尝试在一个假设问题上应用机器学习算法: 我通过以下P…

根据实体属性进行二元分类

我大致在寻找合适的词语来深入探讨这个话题。手头的问题相…

如何计算两个重叠线性数据集之间的点?

我有两组数据,它们有一点重叠(见下图)。我需要找到这两…

Machine-Learning – 概念 / 推荐

大家好,我是机器学习的新手,目前正在寻找一个文本分类解…

识别打乱的数据集

我有两个数据集,其中一个是真实数据集,另一个是随机化数…

选择算法通过浏览历史估计用户性别

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

如何判断机器学习的训练数据是否足够

例如:如果我想训练一个分类器(可能是SVM),我需要收…

什么是classify(LDA)函数的作用?

我正在研究机器学习,并以LDA作为起点。我正在按照Ma…

调用函数时遇到“输入参数不足”的错误,尽管语法正确

我正在自学分类,我阅读并理解了MatLab在线帮助中关…

Naive Bayes: 不平衡测试数据集

我使用scikit-learn的多项式朴素贝叶斯分类器…

使用Vowpal Wabbit计算AUC

在Vowpal Wabbit中是否有办法计算AUC? …

如何在机器学习问题中计算概率而不是实际分类

假设我们有一些数据点可以用作训练集。每行由4个列(特征…

使用Weka命令行创建阈值文件

我需要自动从我的训练分类器中获取阈值曲线,因此我正在研…

生成、判别以及参数化、非参数化算法/模型的区别

在Stack Overflow上,我找到了关于生成和判…

如何根据标签对用户进行聚类

我想根据用户观看的节目的类别或标签对用户进行聚类。有什…

将数据分割成训练和验证数据集,其中类别不具代表性

我有一个包含130000条记录和15个变量的数据集。 …

隐藏马尔可夫模型在Matlab中对序列进行分类

我对机器学习非常新手,我已经阅读了关于Matlab统计…

关于环境声音分类的方法和机器学习模型的建议

我目前在环境声音分类方面遇到了一个问题。我想使用音频分…

使用R进行层次预测

已关闭。 此问题不符合 Stack Overflow …

libsvm – 训练信号

我刚开始接触机器学习和支持向量机等领域。我有一组信号的…

SVMlight训练数据格式

我在尝试使用SVM light对路透社文本进行分类,但…

“java.lang.ArrayIndexOutOfBoundsException: 3” 使用 Weka 的 OneClassClassifier

我尝试使用 Weka 的 OneClassClassi…