我通过以下方式加载Keras模型:
model = keras.models.load_model('myModel.h5')model.fit(x,y, batch_size=1, epochs=2)
在最后一行显示了一个错误,表示它希望y是一个2D输入。我的y文件样本是[0,0,-1],可以更改为[[0,0,-1]]或[[0],[0],[-1]]以转换为2D格式。在第一种情况下,错误为:得到形状为(3,)的数组,而期望的形状为(1,);在第二种情况下,错误为:有3个样本,而期望1个样本。
在进行训练之前,我运行了model.predict(),在此过程中它输出的格式为[[0.00251, -0.00526, 0.005476]]
我错过了什么?
模型定义
inputs = Input(shape=(32,32,1))denseModel = DenseNet121(include_top=False, weights=None, input_shape=(32,32,1), pooling='avg')(inputs)denseModel = Dense(32, activation='relu')(denseModel)denseModel = BatchNormalization()(denseModel)denseModelPrediction = Dense(3, activation='tanh', name='predictions')(denseModel)myModel = Model(inputs=inputs, outputs=denseModelPrediction)myModel.compile(loss='sparse_categorical_crossentropy', optimizer='rmsprop', metrics=['accuracy'])myModel.save('myModel.h5')
这里只是初始化它
回答:
您的损失函数(sparse_categorical_crossentropy)期望您的y值进行独热编码。由于您有三个输出节点,损失函数期望y值具有(3,)的形状,因此出现了您的第一个错误。
如果您试图回归三个独立的概率,我建议将损失函数切换为比较数字的函数(例如loss='mse'
均方误差)。这应该能解决您的输入形状问题。您还可以考虑将输出激活函数设置为sigmoid,以便其被强制在零和一之间。