Minimax 算法的 Alpha-beta 剪枝

我花了一整天的时间试图实现极小极大算法,但并没有真正理解它。现在,我认为我理解了极小极大算法的工作原理,但不理解 alpha-beta 剪枝。

这是我对极小极大算法的理解:

  1. 生成所有可能的移动列表,直到达到深度限制。

  2. 评估底层每个节点的游戏局面有多有利。

  3. 对于每个节点(从底部开始),如果该层是最大层,则该节点的分数是其子节点中的最高分。如果该层是最小层,则该节点的分数是其子节点中的最低分。

  4. 如果你试图最大化分数,则执行具有最高分数的移动;如果你想最小化分数,则执行具有最低分数的移动。

我对 alpha-beta 剪枝的理解是,如果父层是最小层,并且你的节点的分数高于最小分数,那么你可以剪掉它,因为它不会影响结果。

然而,我不明白的是,如果你想计算一个节点的分数,你需要知道低于该节点的所有层上的所有节点的分数(根据我对极小极大算法的理解)。这意味着你仍然会使用相同的 CPU 功率。

请问有人能指出我哪里理解错了吗?这个答案( Minimax explained for an idiot )帮助我理解了极小极大算法,但我不明白 alpha beta 剪枝如何提供帮助。

谢谢。


回答:

为了理解 Alpha-Beta 剪枝,请考虑以下情况。现在轮到白方走,白方试图最大化分数,黑方试图最小化分数。

白方评估了 A、B 和 C 三个走法,发现 C 走法可以获得最高分 20。现在考虑在评估 D 走法时会发生什么:

如果白方选择 D 走法,我们需要考虑黑方的反击。一开始,我们发现黑方可以吃掉白方的皇后,由于失去了皇后,这个子树的最小分数是 5。但是,我们还没有考虑黑方的所有反击。是否值得检查其余的反击?不需要。

我们不关心黑方是否能获得低于 5 的分数,因为白方的 “C” 走法可以将分数保持在 20。黑方不会选择分数高于 5 的反击,因为他试图最小化分数,并且已经找到了一种分数为 5 的走法。对于白方来说,一旦 D 走法的最小值(目前是 5)低于 C 走法(确定是 20),C 走法就优于 D 走法。所以我们“剪掉”那里的其余树,返回上一层并评估白方的 E、F、G、H… 走法直到最后。

希望这有帮助。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注