如何使用R中randomForest
调用的结果来预测一些未标记数据的标签(例如,需要分类的现实世界输入)?
代码如下:
train_data = read.csv("train.csv")input_data = read.csv("input.csv")result_forest = randomForest(Label ~ ., data=train_data)labeled_input = result_forest.predict(input_data) # 我需要类似这样的东西
train.csv:
a;b;c;label;1;1;1;a;2;2;2;b;1;2;1;c;
input.csv:
a;b;c;1;1;1;2;1;2;
我需要得到类似这样的结果
a;b;c;label;1;1;1;a;2;1;2;b;
回答:
如果这是你想要的结果,请告诉我。
你用训练数据来训练你的随机森林模型:
# 训练数据集train_data <- read.csv("train.csv")# 训练随机森林forest_model <- randomForest(label ~ ., data=train_data)
现在随机森林模型已经训练好了,你想要给它新的数据,让它预测标签是什么。
input_data$predictedlabel <- predict(forest_model, newdata=input_data)
上述代码会在你的input_data中添加一个新列,显示预测的标签。