在RapidMiner中使用测试数据集

我正在尝试使用训练数据集创建一个模型,并希望对测试数据…

SGD模型的”过度自信”

我正在使用Apache Mahout处理一个二元分类问…

为什么liblinear不预测多数类?

大多数机器学习分类器在遇到之前从未见过的特征实例时,会…

如何从文本文档中预测连续值(时间)?

已关闭。 此问题不符合主题。目前不接受回答。 想要改进…

在scikit-learn中实现K邻居分类器,每个对象有3个特征

我想使用scikit-learn模块实现一个KNeig…

在Weka分类中的类先验概率的作用

我有一个包含1568行的训练数据集,每行都有一个类属性…

计算多个分类器的得分

我试图在一个大型集合中确定物品对之间的相似性。这些物品…

如何理解SVM中的功能边界?

我在阅读Andrew NG的机器学习笔记时,对功能边界…

SVM在异构特征空间中的学习

我正在进行一些文档分类任务,目前SVM在基于TF*ID…

机器学习电子邮件优先级排序 – Python

我一直在开发一个使用Python编写的优先级电子邮件收…

如何通过简单的模拟模型生成用于分类分析的具有二元响应和4-5个特征的人工数据集?

目前来看,这个问题不适合我们的问答格式。我们期望答案有…

使用scikit-learn中的朴素贝叶斯分类器混合处理分类和连续数据

我在Python中使用scikit-learn开发一个…

选择分类算法来对混合的标称和数值数据进行分类?

我有一个包含大约10万条记录的客户购买模式数据集。数据…

选择特征以识别Twitter问题是否“有用”

我通过使用正则表达式从Twitter的流中收集了一批问…

SKLearn 交叉验证:

我在进行文本分类,可能会遇到训练数据中未包含的词汇,这…

结合多种特征使用支持向量机

我想使用方向梯度直方图和局部二值模式结合支持向量机。但…

用于估计评分的分类算法

我想检测文本文章的情感倾向。这个问题似乎与分类问题有关…

如何在Matlab中使用训练好的神经网络进行实时系统分类

我使用Matlab神经网络工具箱在包含语音特征和加速度…

什么是前馈包装方法的特征选择?

为了学校项目,我需要从UCI数据仓库中选择一个数据集,…

如何修复ROC曲线中低于对角线的点?

我在构建接收者操作特征(ROC)曲线以使用曲线下面积(…

如何处理C4.5 (J48)决策树中的缺失属性值?

使用Weka的C4.5 (J48)决策树处理缺失特征属…

处理朴素贝叶斯分类器中缺失属性的问题

我正在编写一个朴素贝叶斯分类器,用于通过WiFi信号强…

在MATLAB中创建分类器并与classperf一起使用

我正在开发一个新模型,想使用classperf来检查我…

监督潜在 Dirichlet 分配用于文档分类?

我有一组已经由人工分类的文档,分属于不同的组别。 有没…

如何从scikit-learn中的TD-idf向量中提取每个文件的最高频词项?

我试图从scikit-learn中的向量中提取最高频词…