我一直在使用随机森林开发模型。我的训练数据集有15列,假设为A到O。模型使用上述特征进行训练。假设测试集也将具有相同数量的特征或列。但现在客户添加了一些列,模型无法对新数据进行预测。这适用于回归和分类问题。
除了训练数据中已有的列之外,有没有办法或机制来处理或避免新添加的列?我们需要明确编写代码吗?还是有任何参数或内置函数可以处理这种情况?感谢您的帮助。谢谢!
回答:
只需保留训练数据的列列表,并在测试数据中仅使用此列表中的列即可。
我一直在使用随机森林开发模型。我的训练数据集有15列,假设为A到O。模型使用上述特征进行训练。假设测试集也将具有相同数量的特征或列。但现在客户添加了一些列,模型无法对新数据进行预测。这适用于回归和分类问题。
除了训练数据中已有的列之外,有没有办法或机制来处理或避免新添加的列?我们需要明确编写代码吗?还是有任何参数或内置函数可以处理这种情况?感谢您的帮助。谢谢!
回答:
只需保留训练数据的列列表,并在测试数据中仅使用此列表中的列即可。