给定以下数据集:
颜色 | 大小
红色 | 大
白色 | 小
红色 | 大
红色 | 小
白色 | 大
红色 | 大
以及以下贝叶斯网络: 颜色 –> 大小,我需要找到贝叶斯网络的最大似然参数。估计器会是什么?我不确定如何进行,所以任何帮助都将不胜感激。
回答:
假设你的颜色和大小变量遵循多项分布,你需要估计以下参数 :
对于颜色:
: 红色的概率。
: 白色的概率。
对于大小:
: 给定红色时为大的概率。
: 给定白色时为大的概率。
: 给定红色时为小的概率。
: 给定白色时为小的概率。
最终只有3个参数,因为
,
似然度是给定模型时观测数据的概率,在这种情况下,对于一个包含n个颜色和大小观测的数据集:
,
和参数:
,
似然度由以下给出:
由于我们在这里处理的是给定颜色的颜色和大小的伯努利分布,我们可以这样写:
其中 是红色且小的观测次数,其他M的定义类似。
最后,通过优化似然函数,你可以得到参数估计器: