我是机器学习的新手。当我学习逻辑回归时,使用了一对多(一对其余)方法进行多分类:在逻辑回归中,假设函数试图估计正类别的概率。假设我们有3个类别,那么对于每个类别,我们应该预测假设函数h(x)
h1(x)=P(y=1|x)h2(x)=P(y=2|x)h3(x)=P(y=3|x)
然而,这三个概率的总和并不等于1?我“感觉”它应该等于1,但我不知道为什么它不等于1。有人能解释一下为什么吗?
回答:
你的结果是正确的,h1(x)
、h2(x)
和 h3(x)
的总和不应该等于1。
由于你进行了一对多分类,那么对于每个类别(例如,类别1),你有两个概率 p(y=1|x)
和 p(y!=1|x)
,它们的总和为1:
p(y=1|x) + p(y!=1|x) = 1.
但是,由于你的一对多分类是独立的,那么
p(y!=1|x) != p(y=2|x) + p(y=3|x)(至少不一定)。
也许,通过一个例子更容易理解:
- 第一个分类器说 p(y=1|x) = 0.7 且 p(y!=1|x) = 0.3;
- 第二个分类器说 p(y=2|x) = 0.7 且 p(y!=2|x) = 0.3;
- 第三个分类器说 p(y=3|x) = 0.7 且 p(y!=3|x) = 0.3。
它们都是有效的分类器,但
p(y=1|x) + p(y=2|x) + p(y=3|x) != 1.