为什么我的井字游戏极小极大算法不起作用?

很抱歉这样直接贴出我的代码,但我已经花了几个小时试图找出我的Python极小极大算法哪里出了问题。任何帮助都将不胜感激!

inf = 1000bo = [["x", "o", "o"],      [" ", "o", " "],      [" ", "x", "x"]]    def bestMove(board):    bestScore = -inf    bestMove = None    for i in range(3):       for j in range(3):          if(board[i][j]==" "):            board[i][j]=getTurn(board)            score = minimax(board, searchdepth, True)            board[i][j]=" "            if score > bestScore:                bestScore = score                bestMove = [i, j]print("\n\n\n")return bestMovesearchdepth = 10def minimax(node, depth, maxP):    resultat = win(node)    if resultat=="x": return 1    if resultat=="o": return -1    if resultat=="tie": return 0    if depth == 0: return 0if maxP==True:    value = -inf    for i in range(3):        for j in range(3):            if node[i][j] == " ":                node[i][j] = getTurn(node)                newval = minimax(node, depth - 1, False)                node[i][j] = " "                value = max(newval, value)    return valueif maxP==False:    value = inf    for i in range(3):        for j in range(3):            if node[i][j] == " ":                node[i][j] = getTurn(node)                newval = minimax(node, depth - 1, True)                node[i][j] = " "                value = min(newval, value)    return valueprint(bestMove(bo))

输出: [1, 0]期望输出: [2, 0]


回答:

你总是会在’X’获胜的情况下发送1,这是不正确的。这意味着如果轮到O,它会认为X获胜是一件好事。最简单的方法是根据谁的回合来给予不同的分数,即如果你自己获胜则得分为1,对手获胜则得分为-1,平局则得分为0。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注