我有70,000个二维numpy数组,我想用Keras训练一个CNN网络。将它们保存在内存中是一个选项,但会消耗大量内存。因此,我想将这些矩阵保存到磁盘上,并在运行时加载。一个选项是使用ImageDataGenerator
。问题是它只能读取图像。
我不想将数组存储为图像,因为如果我将它们保存为(灰度)图像,数组的值会发生变化(归一化等)。但最终我想将原始矩阵输入到网络中,而不是因为保存为图像而改变的值。
是否有可能以某种方式将数组存储在磁盘上,并以类似于ImageDataGenerator
的方式迭代它们?
或者,我能否将数组保存为图像而不改变数组的值?
回答:
不使用ImageDataGenerator,您可以通过重写类的一些简单方法来自定义数据生成器类。
您可以参考这篇Medium文章以获取更多信息。
https://medium.com/@ensembledme/writing-custom-keras-generators-fe815d992c5a