scikit-learn GMM 产生正的对数概率

我在使用Python的scikit-learn包中的高斯混合模型来训练我的数据集，然而，我发现当我编写代码

— G=mixture.GMM(…)

— G.fit(…)

— G.score(总特征)

得到的对数概率是一个正的实数…这是为什么呢？对数概率不是应该保证是负的吗？

我明白了。高斯混合模型返回给我们的是对数概率“密度”而不是概率“质量”，所以正值是完全合理的。

如果协方差矩阵接近奇异，那么GMM的表现将不会很好，通常这意味着数据不适合这种生成任务

回答：

正的对数概率是可以接受的。

请记住，GMM计算的概率是一个概率密度函数（PDF），因此在任何单个点上可以大于1。

限制条件是PDF必须在数据域上积分为1。

如果对数概率变得非常大，那么推理算法可能已经达到了退化解（在最大似然估计中，如果你的数据集很小，这种情况很常见）。

为了检查GMM算法是否没有达到退化解，你应该查看每个组件的方差。如果任何方差接近于零，那么这是不好的。作为替代方案，你应该使用贝叶斯模型而不是最大似然估计（如果你还没有这样做的话）。

学技术