适当的启发式机制用于爬山算法

以下问题是我从一门人工智能课程的考试练习中找到的。

enter image description here

“建议一个启发式机制,使用爬山算法来解决这个问题。(S=起点,F=终点/目标)。不允许对角移动。”

由于显然曼哈顿距离或欧几里得距离会将机器人发送到(3,4),而且不允许回溯,那么解决这个问题的可能方案(启发式机制)是什么?

编辑:为了使问题更清晰,我已经在棋盘上标记了一些曼哈顿距离:

enter image description here

显然,使用曼哈顿距离,机器人的下一步将是(3,4),因为它的启发式值为2 – 爬山算法会选择它并永远卡住。目标是尝试找到合适的启发式算法,避免走这条路。


回答:

我把障碍视为热源,并且热量会上升。我将一个单元格的净成本定义为到F的曼哈顿距离加上一个热量惩罚的总和。因此,有一种吸引力将机器人拉向F,同时也有一种排斥力使其远离障碍物。

有两种类型的热量惩罚:

1) 接触障碍物非常不好。查看给定单元格下方一行的相邻2到3个单元格。对于直接在给定单元格下方的每个障碍单元格加15分,对于直接在下方的对角相邻单元格加10分。

2) 对于没有直接接触到障碍物的单元格——热量更加分散。我计算它为单元格所在列及其相邻列下方障碍块平均数的6倍。

以下显示了将这些因素结合起来的结果,以及从S到F的路径:

enter image description here

关键点在于,平均值的方式使得机器人在到达顶行时会向左转而不是向右转。左侧未加热的列使那个方向更凉爽。有趣的是,注意到所有单元格(除了右上角的两个单元格可能例外)都被这种启发式方法吸引到F。

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注