我正在运行这个教程,该教程在MNIST数据集上训练一个简单的MLP。我使用的是CPU。在监控训练循环中的计算机活动时,我发现内存使用量在稳步增加,直到达到100%,然后一切都崩溃了(需要重启)。我之前在自己的脚本中也遇到了这个问题,原本以为是自己犯了错误,但当我在上面的教程中也遇到了相同的问题后,我开始怀疑是Theano的bug,并在github上开启了一个issue。
我使用的是Ubuntu 16.04,并且使用的是Theano的最新版本。
有没有人在CPU上遇到相同的问题?有没有人知道可能是哪个操作导致了这个问题?
回答:
在github上的theano-issues中,我的相关帖子已经提出了一个解决方法。我在这里分享这个答案。
显然,这个问题源自Theano 0.9.0的一个bug。由于这个内存泄漏需要由开发者修复,一个简单的解决方法是回退到Theano 0.8.2。这可以很容易地完成,如下所示:
pip install theano==0.8.2
Theano 0.9.0将会自动卸载并替换为旧版本。
结果:相同的代码,不再有内存泄漏!