非常简单的问题无法被ANN解决？Tensorflow神经网络，人工智能

我不明白为什么这个极其简单的输入-输出问题无法被下面的ANN学习。我猜我的代码里有错误，但找不到它。

X = np.array([[ 1.,  1., -1.,  1.],              [ 1.,  1.,  1.,  1.],              [ 1.,  1.,  1.,  1.]])Y = np.array([[ 1.,  1., -5.,  1.],              [ 1.,  1.,  1.,  1.],              [ 1.,  1.,  1.,  1.]]) model = Sequential()model.add(Dense(4, activation='relu'))model.add(Dense(8, activation='relu'))model.add(Dense(16, activation='relu'))model.add(Dense(4, activation='linear'))model.compile(loss='mse', optimizer='adam', metrics=['mae'])erg = model.fit(X,Y, epochs=10, batch_size=1, verbose=1)

回答：

正如Matias提到的，你在最后一层使用了softmax激活函数，而它无法用于生成你数据集中的结果，因为softmax激活函数仅在你的数据集目标是某种概率时才适合作为输出层的激活函数。使用linear代替softmax应该会有所帮助。

model.add(Dense(4, activation='linear'))

学技术

非常简单的问题无法被ANN解决？Tensorflow神经网络，人工智能

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复