变量重要性与ranger

我使用 caret 和 ranger 训练了一个随机森…

在这种情况下应该使用哪种分类器或机器学习SDK?

训练数据(包括训练集和验证集)大约有80百万个样本,每…

如何在Python中逐段对整个数据集应用随机森林分类器

我在参加Kaggle竞赛,测试数据集有880,000行…

操纵随机森林生成分数而不是0/1标签

我的情况是:我能够使用random forest来进行…

将随机森林预测结果作为列添加到测试文件中

我在Python的pandas库中工作(在一个Jupy…

使用RandomClassifier获取特征重要性

我尝试从我的数据框中获取每个特征的重要性权重。我使用了…

如何解释训练/验证学习曲线的结果?

我在使用Scikit包中的随机森林分类器,并绘制了F1…

AdaBoostClassifier 与随机森林在多标签分类中的应用 (sklearn)

我正在尝试在多类别多标签问题上使用 AdaBoostC…

如何将使用PCA和随机森林训练的模型应用于测试数据?

在解决一个机器学习问题时,我在训练数据上应用了PCA,…

sklearn中的随机森林

我在尝试使用sklearn中的随机森林分类器包来拟合一…

如何绘制随机森林模型的学习曲线?

在学习了Andrew Ng的机器学习课程后,我想尝试他…

关于随机森林,OOB误差和Logloss误差有什么区别?

它们都是成本函数吗?也就是说,在评估误差时你会同时考虑…

如何使用Scikit Learn调整随机森林中的参数?

class sklearn.ensemble.Rand…

在scikit-learn的GridSearchCV中评估交叉验证分数的均值和标准差

我使用Python 2.7和scikit-learn进…

机器学习哲学:将模型应用于有偏见的数据

我有一个机器学习问题,不知道是否有理论上的解决方案。 …

随机森林算法能够切换数据集

我很好奇是否有研究将无监督学习和有监督学习结合起来的随…

使用随机森林创建二元结果

我有一个如下所示的数据集: TEAM1 TEAM2 E…

使用决策树进行预测的高效算法(使用R)

我正在修改Brieman的随机森林程序(我不会C/C+…

R tuneRF不稳定,如何优化?

简述 我在尝试使用tuneRF来寻找我的randomF…

如何精确计算袋外误差及其含义?

我找到了几种关于袋外误差的解释,包括Stack Ove…

在Windows上使用Caret进行递归特征消除的并行处理

我正在尝试对包含27个预测变量的数据框进行随机森林的递…

除了词袋模型(TF-IDF)之外,将文本特征转换为数值特征的方法有哪些?

我最近一直在研究自然语言处理。我的目标是根据某些标准,…

删除训练数据中不存在的新因子水平

我在调试使用随机森林包的代码,几乎没有之前的R语言经验…

随机森林回归中的样本大小

如果我理解正确的话,通常在计算随机森林估计器时会应用自…

如何使决策树规则更易于理解?

我想从决策树/随机森林中提取有用的规则,以便开发一种更…