我在理解逻辑回归的概率解释时遇到了困难。具体来说,为什么将逻辑回归函数的输出视为概率是有效的?
回答:
任何类型的分类都可以通过建模类条件密度 p(x|C_k)
(即给定类 C_k
,x
属于该类的概率是多少),以及类先验概率 p(C_k)
(即类 C_k
的概率是多少),将其视为一个 概率生成模型,这样我们就可以应用贝叶斯定理来获得后验概率 p(C_k|x)
(即给定 x
,它属于类 C_k
的概率是多少)。之所以称为 生成,是因为正如 Bishop 在他的书中所说,你可以使用该模型通过从边缘分布 p(x)
中抽取 x
的值来生成合成数据。
这意味着,每次你想将某物分类到特定类别中(例如,肿瘤的大小是恶性还是良性),都会有一个正确或错误的概率。
逻辑回归使用 Sigmoid 函数(或逻辑函数)来对数据进行分类。由于这种函数的范围是从 0 到 1,你可以很容易地将其视为概率分布。最终,你要寻找的是 p(C_k|x)
(在示例中,x
可能是肿瘤的大小,C_0
代表良性类,C_1
代表恶性类),在逻辑回归的情况下,这是通过以下方式建模的:
p(C_k|x) = sigma( w^t x )
其中 sigma
是 Sigmoid 函数,w^t
是权重 w
的转置集,x
是你的特征向量。
我强烈推荐你阅读 Bishop 的书 的第 4 章。