我正在尝试构建一个神经网络,以从63个输入中预测3个输出值。我有一个数据集,包含两个形状为[8100, 63]和[8100, 3]的numpy数组,但当我尝试将它们输入到Keras时,模型不收敛,均方误差在10^11的范围内。
我用来计算数据的函数没有任何非线性特性,所以我最初认为一到两层应该足够了。使用三层时,均方误差仍然在10^10的范围内,我不确定自己做错了什么。
回归应该返回三个绝对值,这些值可以大于1——这就是我没有使用softmax层的理由。
我非常感激任何输入或帮助!
import numpy as npfrom keras.models import *from keras.layers import Densefrom keras import optimizersfrom keras.utils import plot_modelnp.random.seed(7)#Define Inputtf_features_64 = np.load("IN.npy")tf_labels_64 = np.load("OUT.npy")tf_features_32 = tf_features_64.astype(np.float32)tf_labels_32 = tf_labels_64.astype(np.float32)X = tf_features_32Y = tf_labels_32#create Layersvisible = Input(shape=(63,))x = Dense(100, activation='relu')(visible)x = Dense(100, activation='relu')(x)x = Dense(100, activation='relu')(x)x = Dense(70, activation='relu')(x)x = Dense(30, activation='relu')(x)output = Dense(3)(x)Optimizer = optimizers.adam(lr=0.001)model = Model(inputs=visible, outputs = output)model.compile(optimizer=Optimizer, loss='categorical_crossentropy', metrics=['mse'] )model.fit(X, Y, epochs=400, batch_size=300, shuffle=True)print(model.summary)
回答:
当我们使用神经网络进行分类时,我们应该在最后一层使用softmax
,并使用categorical_crossentropy
作为损失函数。
output = Dense(3, activation='softmax')(x)model.compile(optimizer=Optimizer, loss='categorical_crossentropy')
对于回归,我们应该使用linear
输出和mse
损失函数
output = Dense(3)(x)model.compile(optimizer=Optimizer, loss='mse')
您使用categorical_crossentropy
作为损失函数,并使用mse
作为度量指标
model.compile(optimizer=Optimizer, loss='categorical_crossentropy', metrics=['mse'] )
将损失函数更改为mse
model.compile(optimizer=Optimizer, loss='mse')