我正在尝试使用Keras进行情感分类。我尝试使用基本的神经网络(没有使用RNN或其他更复杂的类型)。然而,当我运行脚本时,在训练/评估过程中我没有看到准确性有所提高。我猜测我可能在设置输出层时出错了,但我并不确定。y_train
是一个列表[1,2,3,1,2,4,5]
(包含5个不同的标签),其中包含X_train_seq_padded
中特征的目标。设置如下:
padding_len = 24 # 每个分词句子的长度
neurons = 16 # 填充文本长度的2/3
model = Sequential()
model.add(Dense(neurons, input_dim = padding_len, activation = 'relu', name = 'hidden-1'))
model.add(Dense(neurons, activation = 'relu', name = 'hidden-2'))
model.add(Dense(neurons, activation = 'relu', name = 'hidden-3'))
model.add(Dense(1, activation = 'sigmoid', name = 'output_layer'))
model.compile(optimizer = 'adam', loss = 'categorical_crossentropy', metrics=['accuracy'])
callbacks = [EarlyStopping(monitor = 'accuracy', patience = 5, mode = 'max')]
history = model.fit(X_train_seq_padded, y_train, epochs = 100, batch_size = 64, callbacks = callbacks)
回答:
首先,在您上面的设置中,如果您在最后一层的激活函数中选择了sigmoid
,这通常用于二元分类或多标签分类,那么损失函数应为binary_crossentropy
。
但是,如果您的标签表示为多类别并转换为独热编码,那么您的最后一层应为Dense(num_classes, activations='softmax')
,损失函数应为categorical_crossentropy
。
但是,如果您没有转换您的多类别标签而是使用整数,那么您的最后一层和损失函数应为
Dense(num_classes) # 带有logits的SparseCategoricalCrossentropy(from_logits= True)
或者,(@***)
Dense(num_classes, activation='softmax') # 带有概率的SparseCategoricalCrossentropy(from_logits=False)