卡方作为回归问题的评分函数

http://scikit-learn.org/0.9/modules/feature_selection.html中有记载:”警告 请勿在分类问题中使用回归评分函数。”

我正在尝试为一个回归问题寻找最佳特征,并使用f_regression作为评分函数。但它极其耗费内存,我的8GB内存的机器会卡住,最终我会得到内存错误。

我已经在同一个问题上使用了卡方作为评分函数,它运行得非常快。想知道警告的反面是否成立?如果不是,我能否在回归问题中使用卡方作为评分函数?


回答:

χ²检验构建了一个n_classes乘以n_features的列联表。在回归模型中,没有n_classes的概念。唯一能使其工作的方法是将你的y值分箱,进行特征选择,然后在原始的y和减少后的特征集上训练回归模型。scikit-learn中没有对此的支持,所以你需要自己编程实现。

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注