无法获取测试数据集的R平方

我正在尝试学习一些关于不同类型回归的知识,并正在努力理解下面的代码示例。

library(magrittr)library(dplyr)# 多项式1次df=read.csv("C:\\path_here\\auto_mpg.csv",stringsAsFactors = FALSE) # 数据来自UCIdf1 <- as.data.frame(sapply(df,as.numeric))# 选择关键列df2 <- df1 %>% select(cylinder,displacement,horsepower,weight,acceleration,year,mpg)df3 <- df2[complete.cases(df2),]smp_size <- floor(0.75 * nrow(df3))# 分割为训练和测试集train_ind <- sample(seq_len(nrow(df3)), size = smp_size)train <- mtcars[train_ind, ]test <- mtcars[-train_ind, ]Rsquared <- function (x, y) cor(x, y) ^ 2# 拟合1次模型fit <- lm(mpg~. ,data=train)rsquared1 <-Rsquared(fit,test$mpg)sprintf("R-squared for Polynomial regression of degree 1 (auto_mpg.csv)  is : %f", rsquared1)

我遇到了以下错误:

'Error in cor(x, y) : 'x' must be numeric'

我从这里获取了代码示例(1.2b & 1.3a)。

https://gigadom.wordpress.com/2017/10/06/practical-machine-learning-with-r-and-python-part-1/

原始数据在这里可以获取。

https://raw.githubusercontent.com/tvganesh/MachineLearning-RandPython/master/auto_mpg.csv


回答:

几分钟前,我在计算R2(R平方)的函数上获得了一个赞。现在我想这是你给的,谢谢。

Rsquare函数需要两个向量,但你传递了一个模型对象fit(这是一个列表)和一个向量test$mpg。我想你应该在这里使用predict(fit, newdata = test)作为它的第一个参数。

Related Posts

在使用k近邻算法时,有没有办法获取被使用的“邻居”?

我想找到一种方法来确定在我的knn算法中实际使用了哪些…

Theano在Google Colab上无法启用GPU支持

我在尝试使用Theano库训练一个模型。由于我的电脑内…

准确性评分似乎有误

这里是代码: from sklearn.metrics…

Keras Functional API: “错误检查输入时:期望input_1具有4个维度,但得到形状为(X, Y)的数组”

我在尝试使用Keras的fit_generator来训…

如何使用sklearn.datasets.make_classification在指定范围内生成合成数据?

我想为分类问题创建合成数据。我使用了sklearn.d…

如何处理预测时不在训练集中的标签

已关闭。 此问题与编程或软件开发无关。目前不接受回答。…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注