我是一个AI的新学习者。我的作业要求我用Python编写一个程序来最优地玩Nim游戏(使用NegaMax
算法)。
如果你对这个游戏不熟悉,这里有一个简短的描述:
Nim是一个简单的两人游戏。我们从一堆n根火柴开始,其中n ≥ 3
。
两个玩家,Max和Min,轮流从这堆火柴中取走k根火柴,其中k = 1, k = 2, 或 k = 3
。取走最后一根火柴的玩家输掉游戏。
这是我已经写好的代码:
def NegaMax(state, turn, bestmove): max = -100000000000 if state == 1: if turn == 0: return (-1,bestmove) else: return (1,bestmove) for move in range(1, 4): if state-move > 0: m = NegaMax(state-move, 1-turn, bestmove) m1 = -m[0] if m1 > max: max = m1 bestmove = move return (max,bestmove)def play_nim(state): turn = 0 bestmove = 0 while state != 1: [evaluation,move] = NegaMax(state, turn, bestmove) print(str(state) + ": " + ("MAX" if not turn else "MIN") + " takes " + str(move)) state -= move turn = 1 - turn print("1: " + ("MAX" if not turn else "MIN") + " loses")
无论我输入什么state
的值,Min和Max在每一轮中总是取1根火柴。
我认为问题出在评估上,但我看不出我哪里做错了。任何帮助都将不胜感激!谢谢!
回答:
检查你的停止条件。
你需要:
if state == 1: return (-1,1)
然后一切都会顺利运行。
为了清晰起见,我还建议更改函数签名,因为它只需要state
:
def NegaMax(state): max = -100000000000 if state == 1: return (-1,1) for move in range(1, 4): if state-move > 0: m = NegaMax(state-move) m1 = -m[0] if m1 > max: max = m1 bestmove = move return (max,bestmove)def play_nim(state): turn = 0 while state != 1: [evaluation,move] = NegaMax(state) print(str(state) + ": " + ("MAX" if not turn else "MIN") + " takes " + str(move)) state -= move turn = 1 - turn print("1: " + ("MAX" if not turn else "MIN") + " loses")
它会以最优方式进行游戏。
你可以观察到在最优玩法下的结果,即MAX在状态1+4k(1, 5, 9, 13, 17等)时输掉游戏,而在其他所有状态下赢得游戏。
play_nim(5)5: MAX takes 14: MIN takes 31: MAX losesplay_nim(11)11: MAX takes 29: MIN takes 18: MAX takes 35: MIN takes 14: MAX takes 31: MIN loses