C++中遗传算法的最佳数据结构是什么?

我需要为我的问题(大学项目)实现一个定制的遗传算法,第一个版本将其编码为一个short类型的矩阵(每个染色体的比特数 x 种群大小)。

那是一个糟糕的设计,因为我声明了一个short类型,但只使用了”0″和”1″的值……但那只是一个原型,并且按预期工作,现在是时候开发一个新的、改进的版本了。性能在这里很重要,但简单性也很重要。

我研究了一下,提出了以下方案:

对于染色体:
– String类(例如”0100100010″)
– bool数组
– Vector(vectors似乎针对bool进行了优化)
– Bitset(听起来最自然)

对于种群:
– C Array[]
– Vector
– Queue

我倾向于为染色体选择vector,为种群选择数组,但我想听听在该领域有经验的人的意见。

提前感谢!


回答:

我猜您希望能够随机访问种群和基因。您说性能很重要,我将其理解为执行速度。因此,您最好为染色体使用vector<>,为基因使用vector<char>。使用vector<char>的原因是bitset<>vector<bool>针对内存消耗进行了优化,因此速度较慢。vector<char>将以 x8 内存为代价(假设您的系统上char = 字节)为您提供更高的速度。因此,如果您想要速度,请使用vector<char>。如果内存消耗至关重要,则使用vector<bool>bitset<>bitset<>似乎是这里的自然选择,但是,请记住,它是在比特数上模板化的,这意味着 a) 基因的数量必须是固定的并且在编译时已知(我猜这绝对不可以),并且 b) 如果您使用不同的大小,您最终会得到每个bitset大小的每个使用的bitset方法的副本(尽管内联可能会消除这种情况),即代码膨胀。总的来说,如果您不想要vector<char>,我猜vector<bool>更适合您。

如果您担心vector<char>的美观性,您可以typedef char gene;然后使用vector<gene>,这样看起来更自然。

string就像vector<char>一样,但更麻烦。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注