TensorFlow的许多示例应用程序都会创建Experiment并通过调用tf.contrib.data.learn_runner.run来运行Experiment的一个方法。看起来Experiment本质上是Estimator的一个包装器。
创建和运行Experiment所需的代码看起来比创建、训练和评估Estimator所需的代码更复杂。我相信使用Experiment是有优势的,但我无法弄清楚是什么优势。能有人告诉我吗?
回答:
tf.contrib.learn.Experiment是一个用于分布式训练的高级API。以下是其文档中的内容:
Experiment是一个包含训练模型所需的所有信息的类。
在创建实验后(通过传递一个Estimator以及用于训练和评估的输入),Experiment实例知道如何以适合分布式训练的方式调用训练和评估循环。
就像tf.estimator.Estimator(及其派生类)是一个隐藏矩阵乘法、保存检查点等的高级API一样,tf.contrib.learn.Experiment试图隐藏你为分布式计算所需的样板代码,即tf.train.ClusterSpec、tf.train.Server、作业、任务等。
你可以在没有Experiment的情况下,在单台机器上训练和评估tf.estimator.Estimator。请参见本教程中的示例。