Gaussian Process Regression: 标准差的含义

在以下关于高斯过程回归（GPR）的代码中：

from sklearn.datasets import make_friedman2from sklearn.gaussian_process import GaussianProcessRegressorfrom sklearn.gaussian_process.kernels import DotProduct, WhiteKernelX, y = make_friedman2(n_samples=500, noise=0, random_state=0)kernel = DotProduct() + WhiteKernel()gpr = GaussianProcessRegressor(kernel=kernel, random_state=0).fit(X, y)print gpr.score(X, y)print gpr.predict(X[:2,:], return_std=True)

从gpr.predict(X[:2,:], return_std=True)中获得的“标准差”的含义是什么？

例如，如果我将GPR与支持向量回归（SVR）进行比较，它在predict方法中没有这个选项。当我使用SVR算法时，通常会通过交叉验证获得标准误差。

我在贝叶斯优化中使用它，这就是为什么我需要了解标准误差的来源。

回答：

高斯过程是贝叶斯方法，因此拟合的回归结果是对可能参数的分布。这就允许人们计算预测的分布，而不仅仅是点估计。设置参数return_std=True，方法将返回与每个查询点相关的标准差。这些标准差提供了基于提供的证据（训练数据）强度的理论预测界限。

交叉验证通常在无法精确执行此类分析计算时使用。高斯过程方法的关键优势在于它们的可处理性。

学技术

Gaussian Process Regression: 标准差的含义

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复