谁能解释一下TensorFlow
中one_hot
函数中的axis
参数是什么意思?
根据文档的描述:
axis: 填充的轴(默认值:-1,表示最内层的新轴)
我在Stack Overflow上找到的答案与Pandas有关的解释最接近:
不确定这种解释是否适用于当前的上下文。
回答:
这里有一个例子:
x = tf.constant([0, 1, 2])
… 是输入张量,N=4
(每个索引被转换为4维向量)。
axis=-1
计算one_hot_1 = tf.one_hot(x, 4).eval()
会得到一个(3, 4)
的张量:
[[ 1. 0. 0. 0.] [ 0. 1. 0. 0.] [ 0. 0. 1. 0.]]
… 其中最后一个维度是独热编码的(非常明显)。这对应于默认的axis=-1
,即最后一个维度。
axis=0
现在,计算one_hot_2 = tf.one_hot(x, 4, axis=0).eval()
会得到一个(4, 3)
的张量,这不容易被识别为独热编码:
[[ 1. 0. 0.] [ 0. 1. 0.] [ 0. 0. 1.] [ 0. 0. 0.]]
这是因为独热编码是在0轴上进行的,需要转置矩阵才能看到之前的编码。当输入是更高维度时,情况会变得更加复杂,但基本思想是相同的:区别在于用于独热编码的额外维度的位置。