为什么在线性回归中添加特征会降低准确性?

我是机器学习的新手,正在参加一个kaggle比赛来学习一些知识。当我向数据集中添加某些特征时,准确性反而下降了。

为什么不将增加成本的特征权重设为零(忽略)呢?是因为非线性特征可能会导致局部最小值解吗?

谢谢。


回答:

如果你说的是线性回归分类器的训练误差,那么除非你的代码有bug,否则添加特征总是会减少误差。正如你所说,这是一个凸优化问题,全局解永远不会变差,因为你可以将权重设为零。

然而,如果你说的是测试误差,那么添加特征时过拟合将是一个主要问题,你肯定会观察到这种情况。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注