我的Keras多输出神经网络不收敛，是因为我的层数不够吗？

我正在尝试构建一个神经网络，以从63个输入中预测3个输出值。我有一个数据集，包含两个形状为[8100, 63]和[8100, 3]的numpy数组，但当我尝试将它们输入到Keras时，模型不收敛，均方误差在10^11的范围内。

我用来计算数据的函数没有任何非线性特性，所以我最初认为一到两层应该足够了。使用三层时，均方误差仍然在10^10的范围内，我不确定自己做错了什么。

回归应该返回三个绝对值，这些值可以大于1——这就是我没有使用softmax层的理由。

我非常感激任何输入或帮助！

import numpy as npfrom keras.models import *from keras.layers import Densefrom keras import optimizersfrom keras.utils import plot_modelnp.random.seed(7)#Define Inputtf_features_64 = np.load("IN.npy")tf_labels_64 = np.load("OUT.npy")tf_features_32 = tf_features_64.astype(np.float32)tf_labels_32 = tf_labels_64.astype(np.float32)X = tf_features_32Y = tf_labels_32#create Layersvisible = Input(shape=(63,))x = Dense(100, activation='relu')(visible)x = Dense(100, activation='relu')(x)x = Dense(100, activation='relu')(x)x = Dense(70, activation='relu')(x)x = Dense(30, activation='relu')(x)output = Dense(3)(x)Optimizer = optimizers.adam(lr=0.001)model = Model(inputs=visible, outputs = output)model.compile(optimizer=Optimizer,              loss='categorical_crossentropy',              metrics=['mse']              )model.fit(X, Y, epochs=400, batch_size=300, shuffle=True)print(model.summary)

回答：

当我们使用神经网络进行分类时，我们应该在最后一层使用softmax，并使用categorical_crossentropy作为损失函数。

output = Dense(3, activation='softmax')(x)model.compile(optimizer=Optimizer,          loss='categorical_crossentropy')

对于回归，我们应该使用linear输出和mse损失函数

output = Dense(3)(x)model.compile(optimizer=Optimizer,          loss='mse')

您使用categorical_crossentropy作为损失函数，并使用mse作为度量指标

model.compile(optimizer=Optimizer,              loss='categorical_crossentropy',              metrics=['mse']              )

将损失函数更改为mse

model.compile(optimizer=Optimizer,              loss='mse')

学技术

我的Keras多输出神经网络不收敛，是因为我的层数不够吗？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复