假设你有以下数据集,其中两个变量颜色和大小是被观察到的:
Color | Size ------+------Red | Big White | SmallRed | SmallRed | BigWhite | BigRed | Big
你被要求学习下图所示贝叶斯网络的最大似然参数:
Color -> Size
你获得了表格中描述的学习问题的新数据,但新数据集中包含缺失值。现在你可以使用哪种算法来学习最大似然参数?
回答:
如果你只是丢弃含有缺失值的案例,你会得到不准确的值。
因此,你需要对概率进行预测,为此你可以使用期望最大化算法。 http://en.wikipedia.org/wiki/Expectation%E2%80%93maximization_algorithm