我有一个疑问,假设Softmax层之前的最后一层有1000个节点,而我只有10个类别需要分类,Softmax层应该输出1000个概率值,但它如何只输出10个概率值呢?
回答:
1000节点层的输出将作为10节点层的输入。基本上有以下过程:
x_10 = w^T * y_1000
w
的尺寸必须是1000 x 10
。然后,Softmax函数将应用于x_10
,以生成10个类别的概率输出。
我有一个疑问,假设Softmax层之前的最后一层有1000个节点,而我只有10个类别需要分类,Softmax层应该输出1000个概率值,但它如何只输出10个概率值呢?
回答:
1000节点层的输出将作为10节点层的输入。基本上有以下过程:
x_10 = w^T * y_1000
w
的尺寸必须是1000 x 10
。然后,Softmax函数将应用于x_10
,以生成10个类别的概率输出。