假设我有一个非常大的训练集,导致Matlab在训练时挂起,或者内存不足以容纳整个训练集。
是否可以将训练集分成几部分,然后逐部分训练网络?
是否可以一次训练一个样本(逐个训练)?
回答:
你可以手动将数据集分成批次,然后逐批次进行训练:
for bn = 1:num_batches inputs = <获取批次 bn 的输入>; targets = <获取批次 bn 的目标>; net = train(net, inputs, targets);end
虽然批次大小应该大于1,但无论如何这应该能减少训练时的内存消耗。
在使用trainlm
训练算法的情况下,net.efficiency.memoryReduction
优化选项可能会有所帮助。另外,除了默认的trainlm
算法,你还可以尝试使用消耗内存较少的算法,如trainrp
。有关训练算法的详细信息,请查看Matlab文档页面。以上假设你正在使用Matlab的神经网络工具箱。
关于一次训练一个样本,你可以尝试搜索随机梯度下降算法。但看起来这种方法不在工具箱的默认训练算法集合中。