如何使用一个已经训练和测试过的算法(例如机器学习分类器),在保存后,应用于一个新的观测/数据集上,而我不知道这个观测/数据集的类别(例如,病态与健康),这些类别是基于用于模型训练的预测变量。我使用的是caret包,但找不到相关的代码行。非常感谢
回答:
在训练和测试任何机器学习模型后,您可以将模型保存为.rds
文件,并按如下方式调用:
#将拟合的模型保存为.rds文件saveRDS(model_fit, "model.rds")my_model <- readRDS("model.rds")
创建一个来自相同数据集的新观测,或者您也可以使用一个新的数据集
new_obs <- iris[100,] #我使用的是默认的iris数据集,第100个样本
对新观测进行预测
predicted_new <- predict(my_model, new_obs)confusionMatrix(reference = new_obs$Species, data = predicted_new)table(new_obs$Species, predicted_new)