我在ai
课程的一个项目中研究了遗传算法,但对于传统算法的具体内容有些困惑。
基本上,我在想为什么他们使用不同的选择方法,比如轮盘赌来选择繁殖的父代。为什么不直接选择适应度最高的父代呢?
交叉操作也让我感到困惑。它每次随机选择点来拼接父代信息。但似乎更合理的做法是根据之前的信息来调整交叉。如果已知某个染色体字符串到某一点为止是好的,那么交叉仍然可以是随机的,但不在字符串中好的部分范围内进行。
有什么想法吗?
回答:
选择
如果你总是选择最佳父代,你得到的就是爬山算法。爬山算法运作得很好,但问题越难,你就越有可能陷入无法进一步前进的位置。
一般来说,问题越难,局部最优就越多。除了选择最佳个体外,选择其他个体可以保持种群的多样性:解决方案在搜索空间中分布得更广,如果种群的一部分陷入局部最优,种群的另一部分仍然可以继续前进。
现代遗传算法通常会投入大量精力来保持种群的多样性,以防止过早收敛。一种技术是适应度共享。另一种简单的方法是将种群分为不同的物种,使不同物种的个体不能(或很少能)相互繁殖。
交叉
交叉试图在由于突变而产生的个体之间分配基因组的优良部分。如果能简单地交换基因组的优良部分,确实会很好,这也已经被尝试过;例如,你可以查看每个基因并测量拥有该基因的个体的平均适应度。
然而,这有两个主要问题:
-
计算成本高昂。
-
基因组中可能存在相互依赖性。根据你的度量标准,基因A看起来非常好,而基因B看起来不好,所以你将其排除在外。但实际上,可能基因A在没有基因B的情况下根本不起作用。