我在训练一个有两个类别的CNN模型来进行预测。我知道它会为一个类别给出一个概率,对于另一个类别也是如此,我还知道我可以得到预测的标签,但我不理解给出的结果。难道每个评估输入的输出之和不应该是1.0吗?例如:
[[0.2858745 0.85059494] [0.2858745 0.85059494] [0.6040499 0.5927084 ] [0.8403308 0.291448 ] [0.04195209 0.95504093] [0.79433376 0.21279709] [0.79433376 0.21279709] [0.01326967 0.9891382 ] [0.0153821 0.9867737 ] [0.79433376 0.21279709] [0.01617167 0.98520505] [0.01351487 0.98596036] [0.01473185 0.9846144 ] [0.00896762 0.9899838 ] [0.00936404 0.9893628 ]]
有什么是我没有理解的吗?
我的代码:
model_05_01 = Sequential()model_05_01.add(Conv1D(filters=16, kernel_size=12, input_shape=(x_train.shape[1], 1)))model_05_01.add(MaxPooling1D(pool_size=4))model_05_01.add(Conv1D(filters=32, kernel_size=12))model_05_01.add(MaxPooling1D(pool_size=4))model_05_01.add(Conv1D(filters=16, kernel_size=12))model_05_01.add(MaxPooling1D(pool_size=4))model_05_01.add(Flatten())model_05_01.add(Dense(16, activation='relu'))model_05_01.add(Dense(2, activation='sigmoid'))model_05_01.compile(loss='logcosh', optimizer='adam', metrics=['accuracy'])
回答:
你应该在最后一层使用activation='softmax'
,并且确保你的训练标签已经是一键编码的。
另外,虽然与你的问题无关,但你也应该在卷积层中添加activation='relu'
参数。
最后但同样重要的是,你不应该在分类问题中使用logcosh
损失,因为它是一个回归损失;在给定的softmax分类和一键编码标签的设置中,你应该坚持使用categorical_crossentropy
(正如评论中指出的,损失函数不是超参数)。