高偏差还是高方差?- SVM 和奇怪的学习曲线

我从未见过这样的学习曲线。我的理解正确吗,这种巨大的过拟合现象发生了?模型对训练数据的拟合越来越好,而对测试数据的泛化能力却越来越差。

通常,当存在高方差的情况,如这里所示,更多的样本应该会有所帮助。但在这种情况下,我怀疑它们不会起作用。这是为什么呢?为什么这种学习曲线的例子在文献/教程中不容易找到?

学习曲线。SVM,参数1是C,参数2是gamma


回答:

你需要记住,SVM是非参数模型,因此更多的样本并不一定会减少方差。对于参数模型(如神经网络),方差的减少或多或少可以得到保证,但SVM不是这样——更多的样本不仅意味着更好的训练数据,还意味着更复杂的模型。你的学习曲线是SVM过拟合的典型例子,这在使用RBF核时经常发生。

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注