无法在简单数据集上训练TensorFlow

我正在尝试学习一些关于TensorFlow/机器学习的知识。作为起点，我试图创建一个模型，用一个简单的1-D函数（y=x^2）进行训练，并观察它在训练范围之外的其他输入下的表现。

我遇到的问题是训练函数似乎从未有过改善。我确信这是由于我缺乏理解和/或配置错误，但似乎真的没有针对已知形式数据集的“初学者的机器学习”教程。

我的代码非常简单，并且是从TensorFlow的介绍笔记本中借用的，在这里

我得到的输出类似于这样：

Train on 1000 samplesEpoch 1/51000/1000 [==============================] - 0s 489us/sample - loss: 1996.3631 - mae: 33.2543Epoch 2/51000/1000 [==============================] - 0s 36us/sample - loss: 1996.3540 - mae: 33.2543Epoch 3/51000/1000 [==============================] - 0s 36us/sample - loss: 1996.3495 - mae: 33.2543Epoch 4/51000/1000 [==============================] - 0s 33us/sample - loss: 1996.3474 - mae: 33.2543Epoch 5/51000/1000 [==============================] - 0s 38us/sample - loss: 1996.3450 - mae: 33.2543100/1 - 0s - loss: 15546.3655 - mae: 101.2603

正如我所说，我确信这是由于我的配置错误或缺乏理解。我最喜欢的学习方法是从一个简单的例子开始，然后逐步增加复杂性，而不是从那些我无法立即识别模式的例子开始，但我找不到任何采用这种方法的教程等。有人能推荐一个好的教程来源，或者直接告诉我我在这里做错了什么吗？

回答：

我认为你这里混合了一些问题。我试着逐一向你解释：

首先，你要解决的问题是学习函数f=x^2。这可以归为回归任务。对于回归任务（以及任何其他任务 ^_^），你应该注意激活函数，以及你真正想要预测的内容。

你选择了softmax作为激活函数，这完全不合理。我建议你用线性激活函数替换它（如果你完全删除它，TensorFlow/Keras会自动将其视为线性）。

另一方面，为什么你在最后一层有10个Dense节点？对于每个输入，你只想预测一个值（例如，对于输入值5，你想预测25，对吗），所以一个Dense节点就足够生成你的值了。另一方面，由于你的网络不大，我会从SGD作为优化器开始，但Adam也可能很好。另外，对于你要解决的问题，我不认为你真的需要128个Dense节点作为第一隐藏层。你可以从一个较小的数字开始，看看效果如何。我会从3-4个Dense节点开始。

长话短说，让我们用这些代码行替换你的模型，希望它能正常工作

model = tf.keras.models.Sequential([  tf.keras.layers.Dense(128, activation='relu'),  tf.keras.layers.Dropout(0.2),  tf.keras.layers.Dense(1)])

学技术

无法在简单数据集上训练TensorFlow

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复