我在ai课程的一个项目中研究了遗传算法，但对于传统算法的具体内容有些困惑。

基本上，我在想为什么他们使用不同的选择方法，比如轮盘赌来选择繁殖的父代。为什么不直接选择适应度最高的父代呢？

交叉操作也让我感到困惑。它每次随机选择点来拼接父代信息。但似乎更合理的做法是根据之前的信息来调整交叉。如果已知某个染色体字符串到某一点为止是好的，那么交叉仍然可以是随机的，但不在字符串中好的部分范围内进行。

有什么想法吗？

回答：

选择

如果你总是选择最佳父代，你得到的就是爬山算法。爬山算法运作得很好，但问题越难，你就越有可能陷入无法进一步前进的位置。

一般来说，问题越难，局部最优就越多。除了选择最佳个体外，选择其他个体可以保持种群的多样性：解决方案在搜索空间中分布得更广，如果种群的一部分陷入局部最优，种群的另一部分仍然可以继续前进。

现代遗传算法通常会投入大量精力来保持种群的多样性，以防止过早收敛。一种技术是适应度共享。另一种简单的方法是将种群分为不同的物种，使不同物种的个体不能（或很少能）相互繁殖。

交叉

交叉试图在由于突变而产生的个体之间分配基因组的优良部分。如果能简单地交换基因组的优良部分，确实会很好，这也已经被尝试过；例如，你可以查看每个基因并测量拥有该基因的个体的平均适应度。

然而，这有两个主要问题：

计算成本高昂。
基因组中可能存在相互依赖性。根据你的度量标准，基因A看起来非常好，而基因B看起来不好，所以你将其排除在外。但实际上，可能基因A在没有基因B的情况下根本不起作用。