Home IT技术交叉验证足以确保分类算法中没有过拟合吗？

交叉验证足以确保分类算法中没有过拟合吗？

IT技术 xiaolong · 2025年4月13日 · 0 Comment

我有一个数据集，其中一个类别有45个观测值，另一个类别有55个观测值。此外，我使用了4个不同的特征，这些特征是通过特征选择过滤器预先选择的，尽管这个过程的结果有些奇怪。

另一方面，我在使用Matlab的classificationLearner进行交叉验证，并从不同的分类器中获得了良好的准确率结果（75%到85%）。这能确保没有过拟合吗？还是仍然有可能发生过拟合？我怎样才能确保没有过拟合？

回答：

这真的取决于你所拥有的训练数据集。如果你可用的数据不够具有代表性，无论你使用什么训练和验证方法，你都不会得到一个好的模型。

考虑到这一点，如果你确定你的数据具有代表性（任何“重要”属性的子集的值分布与所有数据的全局集相同），那么交叉验证就足以依赖了。

classification cross-validation machine-learning matlab

发表回复取消回复