merge
和switch
可能并不对普通用户开放使用。我已经搜索了源代码:
在merge
中有这样的描述:
返回
inputs
中可用的元素的值。
这里的可用是什么意思?它是由switch
返回的吗?这是一个示例:
from tensorflow.python.ops import control_flow_opsx_0, x_1 = control_flow_ops.switch(tf.constant(2), False)x_2, x_3 = control_flow_ops.switch(tf.constant(7), True)y = control_flow_ops.merge([x_0, x_1, x_2, x_3])with tf.Session() as sess: print(sess.run(y))
回答:
switch
让我们从检查control_flow_ops.switch
函数开始:
x_0, x_1 = control_flow_ops.switch(tf.constant(2), False)x_2, x_3 = control_flow_ops.switch(tf.constant(7), True)with tf.Session() as sess: print(sess.run(x_0)) # 输出 2 print(sess.run(x_3)) # 输出 7
control_flow_ops.switch
返回一个张量元组,但其中只有一个张量会有值(取决于条件参数)。在上面的例子中,第一个switch
返回x_0 = 2
,第二个switch
返回x_3 = 7
。尝试评估x_1
或x_2
将会导致Retval does not have value错误:
sess.run(x_1) # 失败! sess.run(x_2) # 失败!
换句话说,x_0
和x_3
是可用的,而x_1
或x_2
则不是。
merge
control_flow_ops.merge
执行一个相反的操作:给定一个张量元组,它会选择其中可用的一个。准确地说,它返回一个带名称的元组["output", "value_index"]
,该元组包含一个有值的张量。根据当前的文档,输入应该包含恰好一个可用的张量,这意味着你的示例严格来说是不支持的,并会导致未定义的行为。这里是一个示例:
with tf.Session() as sess: print(sess.run(merge([x_0, x_1]))) # Merge(output=2, value_index=0) print(sess.run(merge([x_1, x_0]))) # Merge(output=2, value_index=1) print(sess.run(merge([x_2, x_3]))) # Merge(output=7, value_index=1) print(sess.run(merge([x_3, x_2]))) # Merge(output=7, value_index=0) print(sess.run(merge([x_0, x_1, x_2]))) # Merge(output=2, value_index=0) print(sess.run(merge([x_1, x_2, x_3]))) # Merge(output=7, value_index=2)
这两个函数在控制计算流程时都很有用,例如,control_flow_ops.switch
的梯度是通过switch
本身实现的(TensorFlow源代码)。