多元分类中的参数估计

我是新手,正在尝试排版我的问题,如果有什么不对的地方,请原谅我。

我正在尝试为一个多元分类问题构建一个贝叶斯分类器,其中输入被假设为具有多元正态分布。我选择使用定义为log(likelihood * prior)的判别函数。

然而,从分布来看,

$${f(x \mid\mu,\Sigma) = (2\pi)^{-Nd/2}\det(\Sigma)^{-N/2}exp[(-1/2)(x-\mu)’\Sigma^{-1}(x-\mu)]}$$

我遇到了一个项 -log(det($S_i$)),其中$S_i$是我针对特定类别i的样本协方差矩阵。由于我的输入实际上代表了方形图像数据,我的$S_i$发现了相当多的相关性,导致det(S_i)为零。然后我的判别函数全部变成Inf,这对我来说是灾难性的。

我知道这里肯定有很多事情出了问题,有没有人愿意帮帮我?


更新:有谁能帮我解决公式的问题?


回答:

我没有分析这个概念,因为我不是很清楚你在这里试图实现什么,也不了解数据集,但关于协方差矩阵的问题:

对于那些你需要协方差矩阵及其行列式的数值数据,最明显的解决方案是使用某种降维技术,以捕捉最有信息量的维度,并简单地丢弃其余部分。一种这样的方法是主成分分析(PCA),将其应用于你的数据,并在例如5-20维后截断,将会得到非零行列式的降维协方差矩阵。

附注:将这个问题发布到Cross Validated可能是个好主意

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注