Home IT技术如何处理测试数据中训练数据未包含的额外列

如何处理测试数据中训练数据未包含的额外列

IT技术 xiaolong · 2025年4月13日 · 0 Comment

我一直在使用随机森林开发模型。我的训练数据集有15列，假设为A到O。模型使用上述特征进行训练。假设测试集也将具有相同数量的特征或列。但现在客户添加了一些列，模型无法对新数据进行预测。这适用于回归和分类问题。

除了训练数据中已有的列之外，有没有办法或机制来处理或避免新添加的列？我们需要明确编写代码吗？还是有任何参数或内置函数可以处理这种情况？感谢您的帮助。谢谢！

回答：

只需保留训练数据的列列表，并在测试数据中仅使用此列表中的列即可。

a-star google-prediction machine-learning random-forest

发表回复取消回复