在阅读《统计学习的要素》一书第2章的线性回归内容时,我遇到了两个方程,我无法理解第二个方程是如何从第一个方程推导出来的。
背景:
我们如何将线性模型拟合到一组训练数据上?有许多不同的方法,但迄今为止最流行的是最小二乘法。在这种方法中,我们选择系数β来最小化残差平方和
方程1
RSS(β)是参数的二次函数,因此其最小值总是存在的,但可能不是唯一的。用矩阵表示法来描述解是最容易的。我们可以写成
方程2
其中X是一个N × p矩阵,每行是一个输入向量,y是训练集中输出的N向量。
第一个方程:
第二个方程:
回答:
我明白了。第二个方程的右边是以矩阵形式表示的,要得到第一个方程,你需要将第二个方程右边的一部分进行转置(这是矩阵乘法的方式)