在实现alpha-beta剪枝算法时函数的行为异常

我实现了一个带有alpha-beta剪枝的极小极大算法。为了找到最佳走法,我通过rootAlphaBeta函数调用了alpha-beta算法。然而,在rootAlphaBeta函数中,我发现了非常奇怪的行为。当我以4为ply值调用rootAlphaBeta函数时,它大约进行了20,000次调用,但当我直接调用alphaBeta函数时,仅进行了大约2000次调用。我似乎找不到问题所在,因为调用次数应该是相同的。

两种算法最终找到的走法应该是相同的,对吗?我认为是这样,至少走法的得分是相同的,我无法知道直接调用alphaBeta函数而不通过rootAlphaBeta时,它选择的走法是什么。

def alphaBeta(self, board, rules, alpha, beta, ply, player):
    """实现带有alpha-beta剪枝的极小极大算法。"""
    if ply == 0:
        return self.positionEvaluation(board, rules, player)
    move_list = board.generateMoves(rules, player)
    for move in move_list:
        board.makeMove(move, player)
        current_eval = -self.alphaBeta(board, rules, -beta, -alpha, ply - 1,
                                       board.getOtherPlayer(player))
        board.unmakeMove(move, player)
        if current_eval >= beta:
            return beta
        if current_eval > alpha:
            alpha = current_eval
    return alpha

def rootAlphaBeta(self, board, rules, ply, player):
    """调用alphaBeta函数。返回给定ply值下玩家的最佳走法。"""
    best_move = None
    max_eval = float('-infinity')
    move_list = board.generateMoves(rules, player)
    for move in move_list:
        board.makeMove(move, player)
        current_eval = -self.alphaBeta(board, rules, float('-infinity'),
                                       float('infinity'), ply - 1,
                                       board.getOtherPlayer(player))
        board.unmakeMove(move, player)
        if current_eval > max_eval:
            max_eval = current_eval
            best_move = move
    return best_move

回答:

你的rootAlphaBeta函数没有更新alpha值。它对所有子节点都使用了完整的范围(-inf, inf),而实际上它本可以缩小除第一个子节点之外的所有子节点的范围。这将阻止一些对最终得分没有影响的分支被剪枝,从而增加了节点数量。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注