设计一个机器人来寻找场地中物体的位置

这是我的AI项目的一部分。我需要实现一个机器人,它占据一个正方形,在一个L X W 的正方形场地中。如果场地中的一个正方形是空的,它的值为0,如果它被一个物体占据,它的值为1。一组连续的、值为1的正方形被称为一个物体。

我必须找出场地中所有物体的身份和位置

我拥有以下信息:

sense() : 这个函数返回我相邻8个正方形的占用状态。
move(x) : 允许我向x方向的相邻正方形移动。
getId(x) : 给出我相对于我的x方向上的物体的ID,如果没有物体,则返回-1。

但是,每当我调用sense或getID函数时,物体都可能以较小的概率移动到不同的位置。

我一直在考虑使用BFS来遍历网格。或者,保持一个已经遍历的位置列表并随机移动是否更好?我可以使用哪些AI技术来解决这个问题?规划技术怎么样?


回答:

我喜欢这个问题描述!确定性的方法可能行不通,因为存在一些随机性。此外,由于物体移动,可能会出现新的路径,您可能需要重新访问某些位置。

因此,增强随机移动是一个好的开始。例如,您可以为每个访问过的单元格分配时间戳,并使其更有可能访问未访问过的/较旧的单元格。这类似于蚁群优化中的信息素 http://en.wikipedia.org/wiki/Ant_colony_optimization,只是只有一只蚂蚁。

另一种方法可能是选择随机目标单元格(远处),并尝试到达那里。您可能会在途中遇到物体。围绕这些物体使用朴素的寻路算法,如果这不起作用,只需选择另一个目标。

更新

创建一个稍微聪明的AI的抽象但强大的方法是,首先考虑您可以分配给模型的刚性事实/属性/注释(例如访问过的位置、时间戳、先验知识等)。然后创建一组AI可以使用的简单操作。您可能还想在它们之上创建更复杂的操作。

之后,一切都归结为让AI控制的智能体以非确定性的方式根据当前的事实选择适当的行动。也就是说:为这些可能的行动分配分数,并进行轮盘赌选择 http://en.wikipedia.org/wiki/Fitness_proportionate_selection 或类似的方法来确定下一个行动。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注