卡方作为回归问题的评分函数

http://scikit-learn.org/0.9/modules/feature_selection.html中有记载:”警告 请勿在分类问题中使用回归评分函数。”

我正在尝试为一个回归问题寻找最佳特征,并使用f_regression作为评分函数。但它极其耗费内存,我的8GB内存的机器会卡住,最终我会得到内存错误。

我已经在同一个问题上使用了卡方作为评分函数,它运行得非常快。想知道警告的反面是否成立?如果不是,我能否在回归问题中使用卡方作为评分函数?


回答:

χ²检验构建了一个n_classes乘以n_features的列联表。在回归模型中,没有n_classes的概念。唯一能使其工作的方法是将你的y值分箱,进行特征选择,然后在原始的y和减少后的特征集上训练回归模型。scikit-learn中没有对此的支持,所以你需要自己编程实现。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注