在学习Andrew NG的Coursera机器学习课程时,我发现了一个有趣的现象:在二次回归方程中,房价可能会在某个x值之后下降。有人能解释这是为什么吗?
回答:
Andrew Ng试图说明,二次函数并不适合用来表示房价。
在这个例子中,a、b和c的值是随机选择的。
如图所示,图形先上升到一个最大值,然后开始下降。这并不符合现实世界的情况,因为房价通常不会随着房屋面积的增加而下降。
他建议我们使用不同的多项式函数来更好地表示这个问题,比如三次函数。
在这个例子中,a、b、c和d的值是随机选择的。
实际上,我们会使用完全不同的方法来选择最适合问题的多项式函数。我们会在交叉验证数据集上尝试不同的多项式函数,并让算法选择最适合的一个。如果我们已经知道数据将遵循的趋势(由于先前的数学或物理知识),我们也可以手动选择一个多项式函数来适应数据集。