(Python NegaMax算法在Nim游戏中的应用) 我的代码有什么问题?

我是一个AI的新学习者。我的作业要求我用Python编写一个程序来最优地玩Nim游戏(使用NegaMax算法)。

如果你对这个游戏不熟悉,这里有一个简短的描述:

Nim是一个简单的两人游戏。我们从一堆n根火柴开始,其中n ≥ 3

两个玩家,Max和Min,轮流从这堆火柴中取走k根火柴,其中k = 1, k = 2, 或 k = 3。取走最后一根火柴的玩家输掉游戏。

这是我已经写好的代码:

def NegaMax(state, turn, bestmove):     max = -100000000000      if state == 1:        if turn == 0:            return (-1,bestmove)        else:            return (1,bestmove)           for move in range(1, 4):        if state-move > 0:            m = NegaMax(state-move, 1-turn, bestmove)            m1 = -m[0]            if m1 > max:                max = m1                bestmove = move    return (max,bestmove)def play_nim(state):    turn = 0    bestmove = 0    while state != 1:        [evaluation,move] = NegaMax(state, turn, bestmove)        print(str(state) + ": " + ("MAX" if not turn else "MIN") + " takes " + str(move))        state -= move        turn = 1 - turn    print("1: " + ("MAX" if not turn else "MIN") + " loses")

无论我输入什么state的值,Min和Max在每一轮中总是取1根火柴。

我认为问题出在评估上,但我看不出我哪里做错了。任何帮助都将不胜感激!谢谢!


回答:

检查你的停止条件。

你需要:

if state == 1:    return (-1,1)

然后一切都会顺利运行。

为了清晰起见,我还建议更改函数签名,因为它只需要state

def NegaMax(state):    max = -100000000000    if state == 1:        return (-1,1)    for move in range(1, 4):        if state-move > 0:            m = NegaMax(state-move)            m1 = -m[0]            if m1 > max:                max = m1                bestmove = move    return (max,bestmove)def play_nim(state):    turn = 0    while state != 1:        [evaluation,move] = NegaMax(state)        print(str(state) + ": " + ("MAX" if not turn else "MIN") + " takes " + str(move))        state -= move        turn = 1 - turn    print("1: " + ("MAX" if not turn else "MIN") + " loses")

它会以最优方式进行游戏。

你可以观察到在最优玩法下的结果,即MAX在状态1+4k(1, 5, 9, 13, 17等)时输掉游戏,而在其他所有状态下赢得游戏。

play_nim(5)5: MAX takes 14: MIN takes 31: MAX losesplay_nim(11)11: MAX takes 29: MIN takes 18: MAX takes 35: MIN takes 14: MAX takes 31: MIN loses

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注