在多变量线性回归中进行反向消元时,为什么我们要考虑每个变量的p值?p值如何帮助我们决定是否包含该变量?是因为我们假设所有变量对y值都有显著影响的零假设,如果某个变量的p值小于0.05,那么这个零假设就是错误的吗?
回答:
在多变量回归问题中考虑p值的原因是,每个参数的正确零假设值取决于期望函数以及参数在其中的位置。由于这个函数根据参数的不同可能会给出截然不同的结果,因此基本上不可能有一个单一的假设检验适用于这些模型。
除了p值,另一种考虑这些类型问题的选项是查看每个估计参数的置信区间。这将提供比单一假设检验更有意义的结果。