如何在使用gcloud ML引擎时设置环境变量？

大家好，

（环境：Windows 7，Python 3.6，Keras 和 TensorFlow 库，gcloud ML引擎）

我正在使用gcloud ML引擎运行某些Keras机器学习模型示例，具体参考这里。一切正常，但尽管我使用的是相同的数据进行训练和验证，多次运行中我得到了不同的结果。我的目标是让多次运行的训练结果可重现。

我搜索了一段时间，发现了一些关于如何使Keras结果可重现的解决方案，详见Keras问答。他们首先建议这样做：

首先，你需要在程序启动前（而不是在程序内部）将PYTHONHASHSEED环境变量设置为0。

我知道我可以在自己的本地机器上设置这些变量，或者在部署gcloud函数时设置，如这里所述。

但是，我不知道如何在使用gcloud ML引擎时（在服务器端而不是本地）设置环境变量。因此，当我的模型程序在gcloud服务器上运行时，我无法设置“PYTHONHASHSEED=0”。

顺便说一下，我知道随机性在机器学习领域是有用的特性，但我对如何使结果可重现这个话题还不太熟悉，因此欢迎任何关于这个话题的想法。谢谢！

附：我尝试过在运行时设置环境变量如下：

但这无法达到“在程序启动前设置变量”的效果。因此，通过这行代码，我仍然无法从多次运行中得到相同的哈希结果。另一方面，在本地，如果我在运行代码前设置“PYTHONHASHSEED=0”，我可能会得到相同的哈希结果。

回答：

我认为Cloud ML引擎API没有提供设置环境变量的机制。然而，你可以通过编写一个包装脚本来解决这个问题（注意：未经测试的代码）：

学技术