标准化在线性回归中的效果:机器学习

作为我的作业的一部分,我正在处理几个数据集,并使用线性回归找出它们的训练误差。我在想标准化是否会对训练误差产生影响?我的相关系数和均方根误差在标准化前后是相同的。

谢谢,


回答:

很容易证明,对于线性回归来说,仅通过缩放(通过a)变换输入数据并不重要(同样适用于平移,这意味着任何形式为X' = aX + b的变换,其中a != 0, b为实数,都具有相同的性质)。

X' = aXw = (X^TX)X^Tyw' = (aX^TaX)^-1 aX^Tyw' = 1/a w

因此

X^Tw = 1/a aX^T w = aX^T 1/a w = X'^Tw'^T 

因此,计算误差的投影在缩放前后是完全相同的,所以任何类型的损失函数(独立于x)都会产生完全相同的结果。

然而,如果你缩放输出变量,那么误差将会改变。此外,如果你以更复杂的方式标准化数据集,而不仅仅是乘以一个数字(例如,通过白化或几乎任何旋转),那么你的结果将取决于预处理。如果你使用正则化线性回归(岭回归),那么即使是通过常数缩放输入数据也会产生影响(因为它改变了正则化参数的“意义”)。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注