我对贝叶斯中的后验推断有一个问题。
在贝叶斯推断中,假设我们给定了一个模型 p(x|θ) 和一个先验分布 p(θ),我们观察到了数据集 D ={x_1,x_2,…,x_N},目标是估计通常难以处理的后验分布 p(θ|D)。
有时候我发现有些人选择评估联合分布 p(θ,D),因为这个联合分布与后验分布 p(θ|D) = p(θ,D)/p(D) 成比例,这样做的原因是什么?难道 p(D) 不难评估吗?感谢任何建议。
回答:
你希望通过找到最优参数 θ 来最大化 p(θ|D)。
这可以重写为 argmax P(θ | D) P(D)
然而,P(D) 与 θ 无关。因此你可以忽略它,或者用可读的数学符号表示