当我在研究K折交叉验证时,我对交叉验证误差(CV-error)产生了疑问。随着折数的增加,估计的交叉验证误差会变高、变低还是没有变化(平均而言)?
我认为CV-error会下降。
回答:
CV-error与折数之间的关系并不是说一个上升另一个就下降,这种关系有一定的随意性。我们需要选择K值,以获得对CV-error的最佳估计。选择较大的K值意味着对真实预期误差的高估偏差较小,但方差会较高。
回答主要问题时,K值与CV-error之间的关系取决于许多因素,主要是数据的分布、数据的大小以及模型的真实性能。