Minimax在Scala中的应用

我正在尝试将维基百科上的Minimax算法调整为我在Scala中实现的TicTacToe游戏。我希望X玩家(-1)能够尽量最大化其得分。我找到一个很棒的静态评估函数,在这里,我想使用它。如果棋盘对玩家有利,该函数会返回正数;如果对玩家不利,则返回负数。我尝试了几种变体,但X玩家总是选择第一个可用的移动。方法如下,方法和评估函数可以在这里找到。

我是否遗漏了什么明显的问题?

// 玩家X = -1, 玩家O = 1
def minmax(board:Array[Int], height:Int, player:Int):Double={
  if(height == 0)
    evaluatePosition(board, player)
  var alpha = -player * Double.PositiveInfinity;
  val allBoards = makeAllPossibleMoves(board, player) // 子棋盘数组
  for(b <- allBoards){
    val score = minmax(b, height-1, -player)
    alpha = if (player == -1) Math.max(alpha, score) else Math.min(alpha, score)
  }
  alpha
}

回答:

看起来alpha的初始化值是错误的:

var alpha = -player * Double.PositiveInfinity

这意味着对于X玩家(-1),alpha被初始化为

var alpha = - (-1) * Double.PositiveInfinity

这可以简化为

var alpha = Double.PositiveInfinity

因此,alpha无法再增加,即

alpha = if (player == -1) Math.max(alpha, score) else //...

将不会产生效果。对于另一个玩家(1),alpha被初始化为负无穷大,因此也无法再被最小化。因此,你可以通过简单地从alpha的初始化中移除-1因子来修复这个问题:

var alpha = player * Double.PositiveInfinity

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注