我是新手,正在尝试排版我的问题,如果有什么不对的地方,请原谅我。
我正在尝试为一个多元分类问题构建一个贝叶斯分类器,其中输入被假设为具有多元正态分布。我选择使用定义为log(likelihood * prior)的判别函数。
然而,从分布来看,
$${f(x \mid\mu,\Sigma) = (2\pi)^{-Nd/2}\det(\Sigma)^{-N/2}exp[(-1/2)(x-\mu)’\Sigma^{-1}(x-\mu)]}$$
我遇到了一个项 -log(det($S_i$)),其中$S_i$是我针对特定类别i的样本协方差矩阵。由于我的输入实际上代表了方形图像数据,我的$S_i$发现了相当多的相关性,导致det(S_i)为零。然后我的判别函数全部变成Inf,这对我来说是灾难性的。
我知道这里肯定有很多事情出了问题,有没有人愿意帮帮我?
更新:有谁能帮我解决公式的问题?
回答:
我没有分析这个概念,因为我不是很清楚你在这里试图实现什么,也不了解数据集,但关于协方差矩阵的问题:
对于那些你需要协方差矩阵及其行列式的数值数据,最明显的解决方案是使用某种降维技术,以捕捉最有信息量的维度,并简单地丢弃其余部分。一种这样的方法是主成分分析(PCA),将其应用于你的数据,并在例如5-20维后截断,将会得到非零行列式的降维协方差矩阵。
附注:将这个问题发布到Cross Validated可能是个好主意