在应用正则化逻辑回归时:我将数据分为训练集、交叉验证集和测试集。我希望应用正则化,目前正在选择正则化参数lambda。为此,我尝试不同的lambda值,并在训练集上拟合假设的参数theta。然后,我选择在验证集上给出最低成本函数的lambda值。为此,我应该在计算验证集的成本函数时包含惩罚项还是不包含呢?
回答:
这混淆了两个概念。你通过最小化成本函数(包含正则化项)来选择模型参数(对于给定的超参数如lambda)。但随后这些参数允许你在验证集上进行分类。你衡量分类的正确性与真实情况的匹配程度。你选择能给出最多正确答案的lambda。在那个阶段,包含lambda的成本函数不起作用。