weka无法加载c4.5格式文件,因为存在缺失值

我正在尝试处理一组c4.5格式的数据集,具体请参见这里…

使用PyCluster优化K(理想聚类数量)

我正在使用PyCluster的kMeans对一些数据进…

非负矩阵分解未能收敛

我正在尝试使用库尔巴克-莱布勒散度作为相似性度量来实现…

运行Mahout协同过滤示例:结果在哪里?

我在尝试使用Mahout,并开始构建所有内容并查看示例…

训练集平衡策略

如果你有一个包含不同类别的训练集,并且类别分布极不平衡…

### 朴素贝叶斯文本分类在某一类别上失败的原因是什么?

已关闭。 此问题是非主题相关的。目前不接受回答。 想要…

如何在新(测试)数据上重新创建相同的文档术语矩阵

假设我有基于文本的训练数据和测试数据。更具体地说,我有…

理解数据集的香农熵

我在阅读《Machine Learning In Ac…

如何确定梯度下降算法中的学习率和方差?

我上周开始学习机器学习。当我想编写一个梯度下降脚本来估…

cv::SVM对每个样本的响应为一个类

我在匹配人脸方面是新手,正在尝试学习如何使用带有HOG…

是否有基于Java的开源框架可以根据带分隔符的关键字符串从文本字段中查找值?

是否有基于Java的开源框架可以根据带分隔符的关键字符…

SVM的gamma和cost参数

大家好,我在使用libSVM进行预测时发现了一个奇怪的…

查找决策树中的非单调区域

我有一个二叉决策树T,它接受一个包含n个实数的向量V,…

grid search cross-validation on SVC probability output in sci-kit learn

我想对SVC分类器的概率输出进行网格搜索交叉验证。特别…

Java, Weka: 如何预测数值属性? [duplicate]

这个问题已经有了答案: Java, Weka: 如何预…

仅为一个标签训练nltk分类器

我刚开始学习nltk,并且在按照书本学习。第六章是关于…

在SVM中,支持向量可以不是训练样本吗?

对于所有版本的SVM,如c-svm、v-svm、软间隔…

sklearn GaussianNB – 效果不佳,概率为[nan]

我在为一个课程进行性别分类工作。我之前使用SVMLig…

机器学习算法评估

目前来看,这个问题不适合我们的问答格式。我们期望答案能…

MAXent分类器NLTK输出理解

我正在尝试理解MAXent分类器的classifier…

如何将特征提取器与SimpleCV的SVM分类器一起使用?

我一直在尝试使用SimpleCV的SVMClassif…

在密度图中寻找边界

我对机器学习还很陌生,所以我很乐意接受各种建议。今天我…

使用OpenCV实现多变量随机森林

假设我们要对一支铅笔进行分类,判断它是否健康,我们有两…

精细文本分类 – 该使用什么算法?

我想实现一个大约有150个类别的分类器(可能用Java…

如何处理scikit-learn的特征数量?

我有一个大小为[66k, 56k]的csv文件(行数,…