为什么我们在OLS估计中使用平方残差而不是绝对残差?
我的想法是,我们使用误差值的平方,这样,拟合线以下的残差(这些残差是负的)仍然可以与正误差相加。否则,我们可能会得到一个0的误差,仅仅因为一个巨大的正误差可以与一个巨大的负误差抵消。
那么,为什么我们要平方,而不是简单地取绝对值呢?这是因为对较大误差的额外惩罚(当我们平方时,2的误差不是1的误差的2倍,而是4倍)。
回答:
我认为大的负残差(即远低于线的点)与大的正残差(即高于线的点)一样糟糕。通过对残差值进行平方,我们以相同的方式对待正负差异。为什么我们要对所有平方残差求和?因为我们无法找到一条直线能同时最小化所有残差。相反,我们最小化平均(平方)残差值。