我在使用TensorFlow的tf.contrib.learn中的DNNRegressor估计器时遇到了问题。在估计器的文档页面中,展示了提供输入的两种方法。
第一种方法使用input_fn函数,正如描述的那样,应该用于预处理并将输入提供给估计器,而第二种方法直接提供输入。示例:
def input_function: ... return feature_cols, labelestimator.fit(input_fn=input_function, steps=...)
在这种情况下,feature_cols是一个dict,其中包含:
- 键:指定列名的string,
- 值:指定列值的tf.constant,
label是一个包含标签的单个tf.constant列。
这种方法有效。
X_train = ...y_train = ...estimator.fit(x=X_train, y=y_train, steps=...)
在这种情况下,我不知道应该如何提供X和y。我尝试了以下方法:
- 普通的numpy数组。这只是尝试性的,并没有成功。错误信息是:
KeyError: 'my_column0'
- Pandas DataFrame,其列名对应于定义的列名(在初始化估计器时定义)。尽管现在应该有这个键,我仍然会得到相同的KeyError。
- 传递X=feature_cols和y=label,它们与上述input_fn情况中的定义方式相同。这会导致:
ValueError: Inputs cannot be tensors. Please provide input_fn.
我还尝试了其他结合dict和numpy数组的方法,但都没有成功。我希望能够使用第二种方法使其工作,因为这也适用于将对象传递给evaluate和predict。有谁知道正确的格式吗?另外,有没有办法直接传递numpy数组?
谢谢!
简而言之,直接使用estimator.fit(x=X_train, y=y_train, steps=...)
向tf.contrib.learn估计器提供输入时,输入应该是什么格式?
回答:
我猜我错过了以下警告:某些参数已被弃用。它们将在2016-12-01之后被移除。更新说明:通过将估计器移入单独的类SKCompat中,估计器与Scikit Learn接口解耦。参数x、y和batch_size仅在SKCompat类中可用,估计器将只接受input_fn。示例转换:est = Estimator(…) -> est = SKCompat(Estimator(…))
尽管如此,奇怪的是在2016-12-01之后这些参数仍然存在。