如上图所示(使用链接),我有一个迷宫,状态3包含奖品,而状态7包含电击。老鼠可以随机放置在从1到9的任何状态,并以均匀随机的方式在迷宫中移动。
Pi表示老鼠在从状态i开始的情况下,在到达状态7之前到达状态3的概率。
如何计算Pi,其中i ∈ {1,2,3,4,5,6,7,8,9}。
回答:
设Px为游戏在位置x开始时,在位置3结束的概率。
我们知道P3=1和P7=0。
如果从其他任何一个单元格开始,那么在你移动之后,你实际上是在新的单元格重新开始游戏。因此,其他7个单元格的概率可以从它们可以移动到的邻居的概率中计算出来:
P5 = P2/4 + P4/4 + P6/4 + P8/4
P2 = P1/3 + P5/3 + P3/3
P1 = P2/2 + P4/2
… 等等。
对于每个单元格,你有一个线性方程——9个单元格有9个方程。使用高斯消元法或类似的技术来求解这9个概率的方程组。