换句话说,哪种类型的AI仅基于游戏的当前状态做出决策?提前谢谢!
回答:
从字面上和问题的严格意义上来说,纯粹的反射代理可能会满足这些条件。反射代理仅根据之前的感知或其当前的世界模型来选择行动,因此,根据你对“考虑”的定义,这可能符合要求。
然而,在我看来,这实在是把问题过度延伸了。
在MDP环境中运行策略的代理,可以说仅基于状态做出决策而不考虑未来。但这又引出了一个问题:这个策略从何而来?显然,它来自于对从特定状态采取特定行动的未来奖励的仔细概率考虑。换句话说,代理的算法可能是“运行这个策略”,但确定策略的算法以及策略本身的未来导向才是真正的智能所在。我们认为代理是智能的,因为它确定了这个策略。
(从概念上讲,反射代理的概念实际上是在探讨代理对过去的处理和考虑,而不是未来。我上面所说的是技术上的真实,而不是重要的哲学意义上的真实。)
所有在规划领域的AI本质上都是面向未来的。如果你没有在某种程度上考虑行动的未来结果,你就不是一个智能代理。