两层神经网络的表现不如单层

我正在学习TensorFlow，并尝试创建一个简单的两层神经网络。

教程代码 https://www.tensorflow.org/get_started/mnist/pros 从这个简单的网络开始，达到92%的准确率：

W = tf.Variable(tf.zeros([784, 10]))b = tf.Variable(tf.zeros([10]))y = tf.nn.softmax(tf.matmul(x, W) + b)

我尝试用一个非常简单的网络替换它，增加了一层，但准确率现在下降到84%！！！

layer1_len = 10w1 = weight_var([784, layer1_len])b1 = bias_var([layer1_len])o1 = tf.nn.relu(tf.matmul(x, w1) + b1)w2 = weight_var([layer1_len, 10])b2 = bias_var([10])y = tf.nn.softmax(tf.matmul(o1, w2) + b2)

我对layer1_len使用了几个不同的值以及不同的训练步骤，得到了同样的结果。（请注意，如果我省略weight_var和bias_var的随机初始化，并保持一切为零，准确率会下降到接近10%，基本上和猜测无异。）

我做错了什么？

回答：

你没有做错什么。问题在于增加层数并不自动意味着更高的准确率（否则机器学习问题就差不多解决了，因为如果你需要在图像分类器中获得更高的准确率，你只需在Inception模型中增加一层就能宣称胜利）。

为了向你展示这不仅仅是你的问题，请看这篇高级论文：深度残差学习用于图像识别，他们发现增加层数会降低评分函数（这不重要），以及他们克服这一问题的方法（这很重要）。这里是从中摘出的一小部分：

更深的网络有更高的训练误差，因此测试误差也更高。

学技术

两层神经网络的表现不如单层

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复