将数据分割成训练和验证数据集,其中类别不具代表性

我有一个包含130000条记录和15个变量的数据集。 …

使用e1071库绘制SVM对象时的公式参数

谁能给我一个关于如何在绘制SVM对象时使用公式参数的例…

在R中获取最佳聚类数量

我有一组数据,希望根据Gap统计量来评估最佳的聚类数量…

使用R进行层次预测

已关闭。 此问题不符合 Stack Overflow …

在pamk函数中的参数

我想使用R语言进行基于中心点的分区聚类(详见此处第95…

最佳聚类数量在R中

在关于如何选择聚类数量的Stack Overflow回…

RPART – 特征类型

RPART 对连续变量、有序变量和分类变量使用不同的分…

无监督字符串聚类

我有一份包含1000多个关键词的列表,希望根据相似性将…

回归错误模型类型在R中使用Naive Bayes进行10折交叉验证

我正在对具有2个类别(0和1)的测试数据实施Naive…

C5.0决策树 – c50代码以值1退出

我遇到了以下错误 c50代码以值1退出 我正在使用Ka…

在R中调整SVM时出现错误

我在R中调整SVM时收到了以下错误: #Error i…

在生产环境中部署R模型的选项

考虑到大数据的迅猛发展,令人惊讶的是在生产环境中部署预…

潜在语义索引如何用于特征选择?

我在学习机器学习的过程中,多次看到潜在语义索引(Lat…

使用R绘制包含异常值的箱线图,使整个范围更易于比较。

我在使用R比较几个数值,这些数值是存储在长度为1000…

在sci-kit learn中使用libSVM与在R中使用e1070训练和使用支持向量机有什么区别?

最近我在考虑使用R还是Python来训练支持向量机的问…

在R的GLMNET包中预测拟合模型时遇到问题

我正在尝试使用R的glmnet包中的岭回归方法,根据多…

在R中如何设置Kohonen SOM的聚类数量?

我有一组数据,想用R中的Kohonen SOM进行聚类…

从随机森林模型中提取子树进行预测

根据Liaw关于随机森林的分类和回归论文中的说法,“确…

R中大数据内存问题

我在R中创建了一个tdm矩阵,想将其写入文件。这是一个…

R – 重复执行脚本

我有一个R脚本,用于进行特定的Twitter搜索,并将…

如何在对训练数据进行聚类后预测新数据的聚类?

我已经使用 hclust 训练了我的聚类模型: mod…

神秘的LDA绘图错误

我在尝试绘制一些我用某些数据训练的LDA分类器的图表时…

在Solr索引中对文档进行聚类(使用自定义距离)

我想使用k-means聚类(机器学习)来对Solr L…

使用nnet进行股票价格预测

stock<-structure(list(we…

如何在K-means中使用欧几里得距离之外的其他距离公式

我正在处理经纬度数据。我需要根据两点之间的距离进行聚类…