C++ 四子连线游戏中的AlphaBeta算法不够智能

我在做一个学校项目,需要编写一个由AI控制的Alpha-Beta算法,但我的算法表现得非常不一致。有时候它能成功阻挡我的所有移动,有时候却会忽略我的三连线,如这里所示。为什么会发生这种情况?我该如何解决这个问题?

int alphaBeta(const State board, int alpha, int beta, const Player player, int depth){    //Max player = Player::O    //Min player = Player::X    std::vector<Move> possibleMoves = getMoves(board);    if(eval(board)==Player::X){return 9999-depth;}      //Player X wins    else if(eval(board)==Player::O){return -9999+depth;}    //Player O wins    else if(possibleMoves.size()==0){return 0;}     //Tie    else{   //Zoek verder        depth++;        State nextBoard = board;        int result;        if(player==Player::O){            for (Move move: possibleMoves) {                nextBoard = doMove(nextBoard, move);                result = alphaBeta(nextBoard, alpha, beta, Player::X, depth);                if (result > alpha){                        alpha = result;                     if (depth == 1){                                    choice = move; //The actual move he will do                    }                }                else if (alpha >= beta){                     return alpha;                 }            }            return alpha;        }        else{            for (Move move: possibleMoves) {                nextBoard = doMove(nextBoard, move);                result = alphaBeta(nextBoard, alpha, beta, Player::O, depth);                if (result < beta){                     beta = result;                    if (depth == 1){                                    choice = move;                    }                }                else if (beta <= alpha){                     return beta;                }            }            return beta;        }    }}

回答:

你反复修改nextBoard,向其中添加了(可能是非法的)移动:

nextBoard = doMove(nextBoard, move);

但你应该在原始棋盘上依次尝试每个移动:

State nextBoard = doMove(board, move);

(免责声明:可能还存在其他问题。)

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注