我对机器学习非常新手,想知道是否可以手动清空LSTM的短期记忆。例如,如果我想用句子“Jack and Jill went up the,”来训练LSTM,但决定不结束这个句子。然后我想用“Humpty dumpty sat on a wall,”来训练它,我该如何防止它立即预测出“hill”这个词?我使用的是Keras。
回答:
相关内容:Keras何时重置LSTM状态?
如果你使用的LSTM是无状态的(stateful = False
,我认为这对你来说更合适),或者你通过将这两个句子放在同一个批次中来训练LSTM,你就不需要重置上下文。
如果你真的需要,可以使用model.reset_state()
。