我有一组数值特征,我想用它们来预测产品的价格。我在这些特征与价格之间没有发现任何有意义的相关性。通过标准化这些特征,我能改善相关性吗?
回答:
如果你只是在测试 corr(x_i, y),其中 y 是价格,x_i 是第 i 个特征,那么不行,标准化并不能改善这个值,因为相关性是对仿射变换不变的,这意味着对于任何选择的 a, b, c, d > 0
corr(a + bx_i, c + dy) = corr(x_i, y)
我有一组数值特征,我想用它们来预测产品的价格。我在这些特征与价格之间没有发现任何有意义的相关性。通过标准化这些特征,我能改善相关性吗?
回答:
如果你只是在测试 corr(x_i, y),其中 y 是价格,x_i 是第 i 个特征,那么不行,标准化并不能改善这个值,因为相关性是对仿射变换不变的,这意味着对于任何选择的 a, b, c, d > 0
corr(a + bx_i, c + dy) = corr(x_i, y)