TensorFlow的许多示例应用程序都会创建Experiment
并通过调用tf.contrib.data.learn_runner.run
来运行Experiment
的一个方法。看起来Experiment
本质上是Estimator
的一个包装器。
创建和运行Experiment
所需的代码看起来比创建、训练和评估Estimator
所需的代码更复杂。我相信使用Experiment
是有优势的,但我无法弄清楚是什么优势。能有人告诉我吗?
回答:
tf.contrib.learn.Experiment
是一个用于分布式训练的高级API。以下是其文档中的内容:
Experiment是一个包含训练模型所需的所有信息的类。
在创建实验后(通过传递一个Estimator以及用于训练和评估的输入),Experiment实例知道如何以适合分布式训练的方式调用训练和评估循环。
就像tf.estimator.Estimator
(及其派生类)是一个隐藏矩阵乘法、保存检查点等的高级API一样,tf.contrib.learn.Experiment
试图隐藏你为分布式计算所需的样板代码,即tf.train.ClusterSpec
、tf.train.Server
、作业、任务等。
你可以在没有Experiment
的情况下,在单台机器上训练和评估tf.estimator.Estimator
。请参见本教程中的示例。