在GitHub的源代码中,如果我在train.batch
中使用allow_smaller_final_batch=True
,所有的批次都会使用dequeue_up_to
而不是dequeue_many
。那么dequeue_up_to
是否更慢呢?我在TensorFlow仓库中搜索后仍然无法找到这个源代码。我已经追踪了dequeue_many
和dequeue_up_to
函数到这里的这个文件,但我无法找到gen_data_flow_ops
及其函数是什么,并且在仓库中搜索只返回了gen_data_flow_ops
被导入的结果。为什么会这样?
回答:
追踪代码从Python路径到C++操作的难度是TensorFlow操作包装技术的不幸后果。通常,C++实现被命名为FooBarOp,而Python最终会在生成的代码中调用foo_bar。
在这种情况下,gen_data_flow_ops._queue_dequeue_up_to_v2是QueueDequeueUpToV2的自动生成的Python包装器,后者是C++DequeueUpToOp的别名。
为了回答你的最初问题,从队列本身来看不太可能有显著的性能差异(dequeue的UpTo版本只有在队列关闭后才做不同的事情)。然而,启用allow_small_batch
会从图中移除一些静态形状信息(批次大小),然而,这可能会使一些基于静态形状优化的后续操作稍微变慢。