如何在sklearn逻辑回归的一对多方案中对概率进行归一化？

在sklearn的LogisticRegression分类器中，我们可以将muti_class选项设置为ovr，即一对多方案，如下面的代码片段所示：

# logistic regression for multi-class classification using built-in one-vs-restfrom sklearn.datasets import make_classificationfrom sklearn.linear_model import LogisticRegression# define datasetX, y = make_classification(n_samples=1000, n_features=10, n_informative=5, n_redundant=5, n_classes=3, random_state=1)# define modelmodel = LogisticRegression(multi_class='ovr')# fit modelmodel.fit(X, y)

现在，这个分类器可以为给定实例分配不同类的概率：

# make predictionsyhat = model.predict_proba(X)

每个实例的概率总和为1：

array([[0.16973178, 0.46755188, 0.36271634],       [0.58228627, 0.0928127 , 0.32490103],       [0.28241256, 0.51175978, 0.20582766],       ...,       [0.17922774, 0.71300755, 0.10776471],       [0.05888508, 0.24924809, 0.69186683],       [0.25808835, 0.68599321, 0.05591844]])

我的问题是：在一对多方法中，每个类都训练一个分类器。因此，我们期望每个类的概率是独立于其他类的。概率是如何归一化以使总和为1的？

回答：

如这里所示，多类别处理是通过对实例x在所有类上的得分进行归一化来处理的：实例属于类k的估计概率由以下公式给出

$\widehat{y_k} = \frac{\frac{exp\{f_k(x)\}}{1+exp\{f_k(x)\}}}{\sum_{j=1}^{K}\frac{exp\{f_j(x)\}}{1+exp\{f_j(x)\}}}$

其中f代表决策函数，K代表类的数量。

学技术

如何在sklearn逻辑回归的一对多方案中对概率进行归一化？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复