我想获取loess函数中每个观测值的置信区间的上限和下限,以复制ggplot
在geom_smooth()
中所做的操作
library(ggplot2)ggplot(mtcars, aes(x = mpg, y = hp)) + geom_point() + geom_smooth(method = 'loess')
我知道可以从线性模型中获取上下界,但对于loess函数来说这是不可用的:
lm_mod <- lm(hp ~ mpg, mtcars)predict(lm_mod, mtcars, interval="confidence", level=0.95)loess_mod <- loess(hp ~ mpg, mtcars)predict(loess_mod, mtcars, interval="confidence", level=0.95)
回答:
我已经解决了这个问题!置信区间可以从标准误差计算出来,这些标准误差可以通过在预测对象中使用se = TRUE
参数来添加。1.96个标准差相当于95%的置信区间(假设错误服从正态分布)。
loess_mod <- loess(hp ~ mpg, mtcars)pred <- predict(loess_mod, mtcars, se=TRUE)mtcars1$lwl <- pred$fit-1.96*pred$se.fitmtcars1$upl <- pred$fit+1.96*pred$se.fitlibrary(ggplot2)ggplot(mtcars1, aes(x = mpg, y = hp)) + geom_point() + geom_smooth(method = 'loess') + geom_line(aes(y = lwl), color = "red") + geom_line(aes(y = upl), color = "red")
希望这对其他人也有帮助。