我最近接触了贝叶斯网络。我了解到它们有助于降低n个随机变量(假设为布尔变量)的联合概率分布的维度。
In GeneralP(X1,X2,X3,.....Xn) = P(X1)*P(X2|X1)*P(X3|X1,X2)*.......*P(Xn|X1,X2,X3,.....Xn-1)
贝叶斯网络通过包含有关哪些变量实际相互依赖的信息来简化公式。这部分我理解了。
我不理解的是它是如何减少计算概率所需的计算量的?我不明白在联合分布的背景下维度的概念。
回答:
好的,我找到了答案。实际上它并没有减少计算量。它只是减少了空间复杂度。这是来自维基百科的一个摘录:
使用贝叶斯网络可以节省大量的内存,如果联合分布中的依赖关系是稀疏的。例如,以表格形式存储10个二值变量的条件概率的简单方法需要存储2^{10} = 1024个值的空间。如果没有变量的局部分布依赖于超过3个父变量,贝叶斯网络表示只需要存储最多10*2^3 = 80个值。贝叶斯网络的一个优势是,对于人类来说,理解(稀疏的)直接依赖关系和局部分布比理解完整的联合分布更直观。