多元分类中的参数估计

我是新手,正在尝试排版我的问题,如果有什么不对的地方,请原谅我。

我正在尝试为一个多元分类问题构建一个贝叶斯分类器,其中输入被假设为具有多元正态分布。我选择使用定义为log(likelihood * prior)的判别函数。

然而,从分布来看,

$${f(x \mid\mu,\Sigma) = (2\pi)^{-Nd/2}\det(\Sigma)^{-N/2}exp[(-1/2)(x-\mu)’\Sigma^{-1}(x-\mu)]}$$

我遇到了一个项 -log(det($S_i$)),其中$S_i$是我针对特定类别i的样本协方差矩阵。由于我的输入实际上代表了方形图像数据,我的$S_i$发现了相当多的相关性,导致det(S_i)为零。然后我的判别函数全部变成Inf,这对我来说是灾难性的。

我知道这里肯定有很多事情出了问题,有没有人愿意帮帮我?


更新:有谁能帮我解决公式的问题?


回答:

我没有分析这个概念,因为我不是很清楚你在这里试图实现什么,也不了解数据集,但关于协方差矩阵的问题:

对于那些你需要协方差矩阵及其行列式的数值数据,最明显的解决方案是使用某种降维技术,以捕捉最有信息量的维度,并简单地丢弃其余部分。一种这样的方法是主成分分析(PCA),将其应用于你的数据,并在例如5-20维后截断,将会得到非零行列式的降维协方差矩阵。

附注:将这个问题发布到Cross Validated可能是个好主意

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注