根据这些人的说法(https://nihit.github.io/resources/spaceinvaders.pdf),在深度强化学习中可以实现早期停止。我之前在Keras上使用深度学习时使用过这种方法,但是,在keras-rl中如何实现呢?是在相同的fit()函数中,还是在将模型发送给代理之前?
回答:
看起来你可以直接使用Keras的回调;如果你真的想要在包中使用它,可以从这里获取,并放到这里。否则,我会尝试:
from keras.callbacks import EarlyStoppingearly_stop = EarlyStopping(patience=69) # 在终止前允许的停滞轮数# 从他们的示例cem_cartpole.py中cem.fit(env, nb_steps=100000, visualize=False, callbacks=[early_stop], verbose=2)