我正在构建一个简单的多层感知器,它以图像作为输入,并输出图像的分类。我的图像数据集由大小为(n x m)的灰度图像组成。我选择了nm个输入神经元作为输入层(实际上我使用PCA进行了降维,但我们先简单处理)。然后我选择了中间隐藏层。现在我应该如何选择输出层呢?需要多少个神经元?为什么?我的分类使用了L个不同的类别(即L种不同类型的图像)。我应该使用单个输出神经元吗?
回答:
由于你有L个不同的类别,你应该有L个输出神经元,在Keras中应该是这样的:
...previous_layer = tf.keras.layers.Dense(4096)(...)output = tf.keras.layers.Dense(self.nb_class)(previous_layer)
如果你是进行二元分类,你需要使用sigmoid激活函数
output = tf.keras.layers.Activation('sigmoid')(output)
如果L > 2,那么你应该选择softmax激活函数。
output = tf.keras.layers.Activation('softmax')(output)
最后一点,在使用Dense层之前,你应该尝试一些卷积层。可以参考VGG16架构。