在《人工智能 – 现代方法》第三版中,我看到了一段有趣的引文,内容如下:
“到目前为止,还没有很好地理解如何将这两种算法[目标导向推理/规划和启发式搜索]结合成一个健壮且高效的系统。”(Russel 第189页)
为什么会这样?为什么将目标导向规划与启发式搜索结合如此困难?强化学习难道不能解决这个问题吗?
回答:
“目标导向推理”这个术语在1980年代被用于描述一种回溯搜索技术。有时它也被称为后向推理或自顶向下搜索,这些名称都指的是同一件事。它描述了算法在状态空间中遍历的方式。更具体地说:它描述了图中状态的访问顺序。在较新的文献中,这个规划者的方面不再详细解释,因为图搜索算法并不是什么大问题。这意味着简单地将节点放入栈中并遍历它们。
相比之下,“启发式搜索”这个术语意味着用基于知识的方法替代暴力求解器。启发式搜索等同于不遍历图,而是找到一种特定领域的策略,跳过图的大部分。确实,将回溯与启发式结合起来是困难的,这种方法被称为基础化。如果有了一个基础化的问题,就有可能在基于知识的问题上使用回溯求解器。这是现代PDDL规划器所采用的策略,它们首先用符号化的PDDL表示法(这是基于知识的)描述领域,然后使用快速求解器在状态空间中搜索。