R mlr – 使用训练数据的子集和整个测试数据创建学习曲线（不是整个训练数据）？

假设我正在创建这样的学习曲线（代码中可能有一些小错误，这只是一个示例）。我想要的是一种经典的学习曲线，即在保持验证/测试集大小不变的情况下，增大训练集。

learningCurve <- generateLearningCurveData("regr.glmnet",                                           bh.task,                                           makeResampleDesc(method = "cv", iters = 5, predict = "both"),                                           seq(0.1, 1, by = 0.1),                                           list(setAggregation(auc, train.mean), setAggregation(auc, test.mean)))

上述代码的问题在于，学习器确实是在训练数据的一部分上进行训练的，但auc.train.mean度量是在整个训练集上计算的。这导致的结果并不是我想要的学习曲线。我希望这个度量能够评估用于学习的那部分训练数据的表现，就像这里一样：

http://www.astroml.org/sklearn_tutorial/practical.html#learning-curves

我认为这句话完全解释了这一点：

请注意，当我们在训练数据的一个小子集上进行训练时，训练误差是使用这个子集计算的，而不是使用整个训练集。

如何实现这一点？

回答：

这个问题已经在这个拉取请求中得到了修复，很快就会合并。

有了这个修复，我在评论中的完整示例中得到了以下学习曲线：

学技术

R mlr – 使用训练数据的子集和整个测试数据创建学习曲线（不是整个训练数据）？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复