调整Python中逻辑回归的多项式特征

如果我想在我的逻辑回归模型中加入二次多项式（该模型有两个预测变量），就像我尝试过的下面的方法：

df_poly = df[['Y','x0','x1']].copy()X_train, X_test, Y_train, Y_test = train_test_split(df_poly.drop('Y',axis=1),                                                     df_poly['Y'], test_size=0.20,                                                     random_state=10)poly = PolynomialFeatures(degree = 2, interaction_only=False, include_bias=False)lr = LogisticRegression()pipe = Pipeline([('polynomial_features',poly), ('logistic_regression',lr)])pipe.fit(X_train, Y_train)

我会得到x0, x1, x0^2, x1^2, x0*x1的系数。

然而，我希望调整这个过程，只拟合x0, x1, x0^2和x0*x1。也就是说，我希望排除x1^2项的可能性。通过sklearn库有办法做到这一点吗？

回答：

我会使用ColumnTransformer、PolynomialFeatures和FunctionTransformer的组合


array([[  0.,  10.,   0.,   0.],       [  1.,  11.,  11.,   1.],       [  2.,  12.,  24.,   4.],       [  3.,  13.,  39.,   9.],       [  4.,  14.,  56.,  16.],       [  5.,  15.,  75.,  25.],       [  6.,  16.,  96.,  36.],       [  7.,  17., 119.,  49.],       [  8.,  18., 144.,  64.],       [  9.,  19., 171.,  81.]])



相关文章：

如何计算给定上下文和可能的词汇中哪个词最适合？
基于策略的学习无法收敛
如何在使用R的Keras包时获取每次调优运行中使用的标志值？
如何修复在使用 optimize.minimize() 时报告的数值错误，但所引用的函数本身没有错误？
马尔可夫强化学习的拟合值迭代算法
tf.keras 预测结果差而评估结果好
线性回归模型（使用梯度下降法）在波士顿房价数据集上不收敛
使用交叉验证调整kNN算法的参数
训练简单策略代理遇到问题。错误：无法找到任何变量与损失函数结果之间的连接 y=f(x)
使用拆分表和完全独立表时评估准确率的差异（CreateML, Swift）

学技术

调整Python中逻辑回归的多项式特征

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复