迭代条件模式在EM算法中的E步

我想了解在EM算法中使用ICM作为E步近似的数学依据是什么。

据我所知,在E步中,目标是找到一个与潜在变量的后验分布相等的分布,这保证了似然函数的增加,或者找到一些更简单的分布家族中的最佳可能分布,这保证了似然函数的下界增加。

如何在这样的E步中数学上证明使用ICM的合理性?任何参考文献/推导/笔记都将非常有帮助。


回答:

让我们考虑一个简单的条件随机场(CRF),它表示给定观测(x)时标记(y)的似然性。还假设似然性依赖于参数\theta。在推断中,你只知道x,并试图推断y。你所做的只是以一种方式应用EM算法,使E步找到标记y(argmax P(y|x,\theta)),而M步找到参数\theta(argmax P(\theta|x,y))。M步可以通过使用任何优化算法来完成,因为\theta通常不是高维的(至少不像y的维度那么高)。E步只是在没有隐藏变量的MRF/CRF上进行推断,因为\theta在M步中是独立优化的。ICM是一种用于执行推断的算法。如果你需要参考文献,可以简单地阅读Murphy的书http://www.cs.ubc.ca/~murphyk/MLbook/,我认为第26章与此相当相关。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注