我想在Keras中创建一个能够“逐样本”学习的模型;这种类型的机器被称为在线学习,即一个能够逐个接收和拟合数据的模型。我的问题是:如何在Keras中实现这一点?仅仅通过在拟合时设置batch_size=1
就可以做到吗?
回答:
在Keras中,批次大小与数据的输入方式无关。批次大小决定了每次梯度更新时将要并行输入网络的样本数量。批次大小的更清晰解释取决于网络的类型。例如,在有状态的RNN中,批次大小为N意味着输入张量包含N个独立的序列。单个批次处理会使所有N个序列向前移动一个样本。因此,在每个批次中,处理N个样本(每个N个独立序列中的一个),并更新梯度。
因此,在你的情况下,似乎只有一个样本流,如果样本是时间序列数据,那么我们肯定需要batch_size=1
。如果在部署模型之前你有一个数据集来训练模型,你可以将它们全部读入内存并fit
模型,部署后当有新的观察数据提供时,你可以反复使用train_on_batch
或fit
来训练模型。没有限制你可以fit
模型的次数。