C++ Negamax alpha-beta 错误剪枝?

我在使用负极大值算法(Negamax)玩四子棋游戏时发现,如果我加入alpha-beta剪枝,有时会得到“错误”的结果,即做出我认为在当前搜索深度下不应该做出的输棋走法。如果我去掉alpha-beta剪枝,它就会按预期进行游戏。alpha-beta剪枝会不会剪掉一些实际上可行的分支(特别是在搜索深度有限的情况下)?以防万一,这里是代码:

int negamax(const GameState& state, int depth, int alpha, int beta, int color){    //是否达到深度终点?或者我们实际上达到了胜/负条件?
    if (depth == 0 || state.points != 0)
    {
        return color*state.points;
    }
    //获取后继状态并优化排序/可能需要修剪
    std::vector<GameState> childStates;
    state.generate_successors(childStates);
    state.order_successors(childStates);
    //没有可能的移动 - 那么它是一个终止状态
    if (childStates.empty())
    {
        return color*state.points;
    }
    int bestValue = -extremePoints;
    int v;
    for (GameState& child : childStates)
    {
        v = -negamax(child, depth - 1, -beta, -alpha, -color);
        bestValue = std::max(bestValue, v);
        alpha = std::max(alpha, v);
        if (alpha >= beta)
            break;
    }
    return bestValue;
}

回答:

alpha-beta剪枝会不会剪掉一些实际上可行的分支(特别是在搜索深度有限的情况下)?

Alpha-Beta算法返回的结果与Minimax算法相同(根节点的评估和游戏路线),但通常能更快地剪掉那些不可能影响最终决策的分支(你可以在H. Fuller的《Analysis of the alpha-beta pruning algorithm by Samuel》 – 1973年中阅读相关证明)。

你使用的是Negamax Alpha-Beta剪枝,但这只是为了简化算法实现的一种变体。

此外,fail-soft技巧并不会改变这种情况。

当然,在浅层深度进行搜索可能会选择不好的走法,但这同样适用于Minimax算法。

所以这应该是实现上的错误。

我认为展示的代码看起来是正确的。你应该检查以下几点:

  1. 你在根节点调用negamax的方式。它应该类似于:

     negamax(rootState, depth, −extremePoints, +extremePoints, color)

    alpha / beta 是可能的最低和最高值。

    如果你对alpha / beta使用了不同的初始值(例如aspiration windows),并且真实分数超出了初始窗口,你需要重新搜索。

  2. 你如何收集/存储/管理/传播主要变体的走法(相关代码缺失)。像PV表这样的技术与bestValue的变化有关。如果这是问题所在,你应该会得到与Minimax算法相同的位置分数,但最佳走法不同。

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注