merge和switch可能并不对普通用户开放使用。我已经搜索了源代码:
在merge中有这样的描述:
返回
inputs中可用的元素的值。
这里的可用是什么意思?它是由switch返回的吗?这是一个示例:
from tensorflow.python.ops import control_flow_opsx_0, x_1 = control_flow_ops.switch(tf.constant(2), False)x_2, x_3 = control_flow_ops.switch(tf.constant(7), True)y = control_flow_ops.merge([x_0, x_1, x_2, x_3])with tf.Session() as sess: print(sess.run(y))
回答:
switch
让我们从检查control_flow_ops.switch函数开始:
x_0, x_1 = control_flow_ops.switch(tf.constant(2), False)x_2, x_3 = control_flow_ops.switch(tf.constant(7), True)with tf.Session() as sess: print(sess.run(x_0)) # 输出 2 print(sess.run(x_3)) # 输出 7
control_flow_ops.switch返回一个张量元组,但其中只有一个张量会有值(取决于条件参数)。在上面的例子中,第一个switch返回x_0 = 2,第二个switch返回x_3 = 7。尝试评估x_1或x_2将会导致Retval does not have value错误:
sess.run(x_1) # 失败! sess.run(x_2) # 失败!
换句话说,x_0和x_3是可用的,而x_1或x_2则不是。
merge
control_flow_ops.merge执行一个相反的操作:给定一个张量元组,它会选择其中可用的一个。准确地说,它返回一个带名称的元组["output", "value_index"],该元组包含一个有值的张量。根据当前的文档,输入应该包含恰好一个可用的张量,这意味着你的示例严格来说是不支持的,并会导致未定义的行为。这里是一个示例:
with tf.Session() as sess: print(sess.run(merge([x_0, x_1]))) # Merge(output=2, value_index=0) print(sess.run(merge([x_1, x_0]))) # Merge(output=2, value_index=1) print(sess.run(merge([x_2, x_3]))) # Merge(output=7, value_index=1) print(sess.run(merge([x_3, x_2]))) # Merge(output=7, value_index=0) print(sess.run(merge([x_0, x_1, x_2]))) # Merge(output=2, value_index=0) print(sess.run(merge([x_1, x_2, x_3]))) # Merge(output=7, value_index=2)
这两个函数在控制计算流程时都很有用,例如,control_flow_ops.switch的梯度是通过switch本身实现的(TensorFlow源代码)。