我正在尝试学习一些关于不同类型回归的知识,并正在努力理解下面的代码示例。
library(magrittr)library(dplyr)# 多项式1次df=read.csv("C:\\path_here\\auto_mpg.csv",stringsAsFactors = FALSE) # 数据来自UCIdf1 <- as.data.frame(sapply(df,as.numeric))# 选择关键列df2 <- df1 %>% select(cylinder,displacement,horsepower,weight,acceleration,year,mpg)df3 <- df2[complete.cases(df2),]smp_size <- floor(0.75 * nrow(df3))# 分割为训练和测试集train_ind <- sample(seq_len(nrow(df3)), size = smp_size)train <- mtcars[train_ind, ]test <- mtcars[-train_ind, ]Rsquared <- function (x, y) cor(x, y) ^ 2# 拟合1次模型fit <- lm(mpg~. ,data=train)rsquared1 <-Rsquared(fit,test$mpg)sprintf("R-squared for Polynomial regression of degree 1 (auto_mpg.csv) is : %f", rsquared1)
我遇到了以下错误:
'Error in cor(x, y) : 'x' must be numeric'
我从这里获取了代码示例(1.2b & 1.3a)。
https://gigadom.wordpress.com/2017/10/06/practical-machine-learning-with-r-and-python-part-1/
原始数据在这里可以获取。
https://raw.githubusercontent.com/tvganesh/MachineLearning-RandPython/master/auto_mpg.csv
回答:
几分钟前,我在计算R2(R平方)的函数上获得了一个赞。现在我想这是你给的,谢谢。
Rsquare
函数需要两个向量,但你传递了一个模型对象fit
(这是一个列表)和一个向量test$mpg
。我想你应该在这里使用predict(fit, newdata = test)
作为它的第一个参数。