除非我理解有误,逻辑回归模型实际上是一个多项式(通常是各项为一阶),其中每个属性都是一个变量,每个变量都有一个相关的权重。
我在Sci-Kit Learn中训练了一个逻辑回归模型,并且希望查看代表该模型的多项式,但我不知道该如何做。
为了举例说明,假设我有一个包含4个属性的数据集X,以及对应的二进制标签y。然后,使用下面的代码
clf = LogisticRegression(penalty='l2', tol=0.0001, solver='lbfgs', max_iter=1000)model = clf.fit(X, y)
我想看到代表模型的方程。换句话说,我想得到这样的东西,其中第i个alpha项是X的第i个属性的权重,而beta是一个常数。
我查看了官方文档,但没有找到实现我希望的方式。有没有关于如何开始实现我的目标的建议?
回答:
正如评论中已经指出的,你可以通过coef_
和intercept_
属性分别获取权重(或LogisticRegression
中的系数)和偏置项(或LogisticRegression
中的截距)。以下是来自文档的两者的描述:
coef_: ndarray of shape (1, n_features) or (n_classes, n_features)
决策函数中特征的系数。
intercept_: ndarray of shape (1,) or (n_classes,).
添加到决策函数中的截距(也称为偏置)。
按照你的例子,你可以做类似这样的事情:
clf = LogisticRegression(penalty='l2', tol=0.0001, solver='lbfgs', max_iter=1000)clf.fit(X, y)print(clf.coef_)print(clf.intercept_)
coef_
中的值对应于特征,即coef_
中的第i个值对应于训练数据中的第i个特征。