无法获取测试数据的输出,在R中的cu.summary数据集上

我已经在R中使用cu.summary数据集创建了一个决策树,并且得到了正确的输出。

但是当我尝试通过提供其他四个变量的值来预测里程(训练数据中的因变量)时,我得到了错误:“变量 ‘Reliability’ 被拟合为 ‘ordered’ 类型,但提供了 ‘factor’ 类型”。

数据集:cu.summary

数据集中的变量:里程,价格,国家,可靠性,类型

    libray(rpart)    fit <- rpart(Mileage~Price + Country + Reliability + Type,method="anova",data=cu.summary)    printcp(fit)    plotcp(fit)    summary(fit)    par(mfrow=c(1,2))    rsq.rpart(fit)    plot(fit, uniform=TRUE)    text(fit, use.n=TRUE , all=TRUE, cex=.8)    post(fit,file = "Desktop/tree_reg.ps")    plot(pfit, uniform=TRUE,main= "Regression tree")    pfit<- prune(fit, cp=0.01160389)    plot(pfit, uniform=TRUE,main= "Pruned regression Tree for mileage")    text(pfit, use.n=TRUE, all=TRUE, cex=.8)    post(fit,file = "Desktop/tree_pruned.ps")    predict(fit,data.frame(Price=7000,Country="Japan",Reliability="worse",Type="Small"))

输出窗口

输出窗口

请帮助我调试这段代码


回答:

在运行 predict 之前,你需要将 Reliability 列转换为有序因子(如在 cu.summary 中那样)。

tmp <- data.frame(Price=7000,Country="Japan",Reliability="worse",Type="Small")tmp$Reliability <- as.ordered(tmp$Reliability)predict(fit, tmp)

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注