最大似然参数估计

给定以下数据集:

颜色 | 大小

红色 | 大

白色 | 小

红色 | 大

红色 | 小

白色 | 大

红色 | 大

以及以下贝叶斯网络: 颜色 –> 大小,我需要找到贝叶斯网络的最大似然参数。估计器会是什么?我不确定如何进行,所以任何帮助都将不胜感激。


回答:

假设你的颜色和大小变量遵循多项分布,你需要估计以下参数 theta:

对于颜色:

  • Theta_red: 红色的概率。
  • Theta_white: 白色的概率。

对于大小:

  • Theta_big|red: 给定红色时为大的概率。
  • Theta_big|white: 给定白色时为大的概率。
  • Theta_small|red: 给定红色时为小的概率。
  • Theta_small|white: 给定白色时为小的概率。

最终只有3个参数,因为

  • theta_white = 1 - theta_red,
  • theta_small|red = 1 - theta_big|red
  • theta_small|white = 1 - theta_big|white

似然度是给定模型时观测数据的概率,在这种情况下,对于一个包含n个颜色和大小观测的数据集:

D = {(color_1, size_1), ..., (color_n, size_n)},

和参数:

theta = {theta_red, theta_big|red, theta_big|white},

似然度由以下给出:

Likelihood

由于我们在这里处理的是给定颜色的颜色和大小的伯努利分布,我们可以这样写:

enter image description here

其中 enter image description here 是红色且小的观测次数,其他M的定义类似。

最后,通过优化似然函数,你可以得到参数估计器:

  • enter image description here
  • enter image description here
  • enter image description here

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注