(Python NegaMax算法在Nim游戏中的应用) 我的代码有什么问题？

我是一个AI的新学习者。我的作业要求我用Python编写一个程序来最优地玩Nim游戏（使用NegaMax算法）。

如果你对这个游戏不熟悉，这里有一个简短的描述：

Nim是一个简单的两人游戏。我们从一堆n根火柴开始，其中n ≥ 3。

两个玩家，Max和Min，轮流从这堆火柴中取走k根火柴，其中k = 1, k = 2, 或 k = 3。取走最后一根火柴的玩家输掉游戏。

这是我已经写好的代码：

def NegaMax(state, turn, bestmove):     max = -100000000000      if state == 1:        if turn == 0:            return (-1,bestmove)        else:            return (1,bestmove)           for move in range(1, 4):        if state-move > 0:            m = NegaMax(state-move, 1-turn, bestmove)            m1 = -m[0]            if m1 > max:                max = m1                bestmove = move    return (max,bestmove)def play_nim(state):    turn = 0    bestmove = 0    while state != 1:        [evaluation,move] = NegaMax(state, turn, bestmove)        print(str(state) + ": " + ("MAX" if not turn else "MIN") + " takes " + str(move))        state -= move        turn = 1 - turn    print("1: " + ("MAX" if not turn else "MIN") + " loses")

无论我输入什么state的值，Min和Max在每一轮中总是取1根火柴。

我认为问题出在评估上，但我看不出我哪里做错了。任何帮助都将不胜感激！谢谢！

回答：

检查你的停止条件。

你需要：

if state == 1:    return (-1,1)

然后一切都会顺利运行。

为了清晰起见，我还建议更改函数签名，因为它只需要state：

def NegaMax(state):    max = -100000000000    if state == 1:        return (-1,1)    for move in range(1, 4):        if state-move > 0:            m = NegaMax(state-move)            m1 = -m[0]            if m1 > max:                max = m1                bestmove = move    return (max,bestmove)def play_nim(state):    turn = 0    while state != 1:        [evaluation,move] = NegaMax(state)        print(str(state) + ": " + ("MAX" if not turn else "MIN") + " takes " + str(move))        state -= move        turn = 1 - turn    print("1: " + ("MAX" if not turn else "MIN") + " loses")

它会以最优方式进行游戏。

你可以观察到在最优玩法下的结果，即MAX在状态1+4k（1, 5, 9, 13, 17等）时输掉游戏，而在其他所有状态下赢得游戏。

play_nim(5)5: MAX takes 14: MIN takes 31: MAX losesplay_nim(11)11: MAX takes 29: MIN takes 18: MAX takes 35: MIN takes 14: MAX takes 31: MIN loses

学技术

(Python NegaMax算法在Nim游戏中的应用) 我的代码有什么问题？

发表回复取消回复

相关文章：

使用 LibSVM 计算与均值/标准差对最接近的匹配项

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复