给定一个张量 t=[[1,2], [3,4]]
,我需要生成 ts=[[1,2,1,2], [1,2,3,4], [3,4,1,2], [3,4,3,4]]
。也就是说,我需要将所有行对堆叠在一起。重要的是,张量的维度为 [None, 2],即第一个维度是可变的。
我尝试过以下方法:
- 使用
tf.while_loop
生成一个索引列表idx=[[0, 0], [0, 1], [1, 0], [1, 1]]
,然后使用tf.gather(ts, idx)
。这种方法虽然可行,但比较杂乱,而且我不知道如何处理梯度问题。 - 使用两个for循环遍历
tf.unstack(t)
,将堆叠的行添加到缓冲区中,然后使用tf.stack(buffer)
。但如果第一个维度是可变的,这种方法就行不通了。 - 尝试从广播中寻找灵感。例如,给定
x=t.expand_dims(t, 0), y=t.expand_dims(t, 1), s=tf.reshape(tf.add(x, y), [-1, 2])
,s
将是 [[2, 4], [4, 6], [4, 6], [6, 8]],即每行组合的和。但是,如何进行堆叠而不是求和呢?我已经尝试了两天,但没有成功 🙂
回答: