在单变量的线性回归中,我可以在图上清楚地看到预测线,并且可以判断它是否正确地拟合了训练数据。我只需创建一个包含一个变量和输出的图,并基于找到的Theta 0和Theta 1的值构建预测线。看起来是这样的:
但是,如何检查在多个变量/特征上实现的梯度下降结果的有效性呢?例如,如果特征的数量是4或5。如何检查它是否正常工作,并且找到的所有theta值是否有效?我是否只能依赖于绘制的成本函数与执行的迭代次数的关系图来判断?
回答:
梯度下降会收敛到一个局部最小值,这意味着第一导数应为零,第二导数应为非正值。检查这两个矩阵将告诉你算法是否已经收敛。