理解神经网络在文档示例（MNIST）中预测的内容

我参加了一个关于神经网络的速成课程，以便更好地理解它们，现在我正在R中尝试使用它们。我正在按照Keras的这个文档进行操作。

我对正在发生的事情的理解：

我们输入一系列图像，并根据这些图像中像素和颜色的排列将这些图像转换为数值矩阵。然后，我们构建一个神经网络模型来学习这些排列的模式，根据分类（0到9）。然后我们使用模型来预测一个图像属于哪个类别。老实说，我承认我并不完全确定y_train和x_train是什么。我只是将其视为一个训练集和一个验证集，所以我不确定x和y之间的区别是什么。

我的问题：

我严格按照步骤操作，模型运行良好，预测结果看起来与文档中的一样。最终，预测结果看起来像这样：

我认为这意味着x_test中的观察1被预测为类别7。

然而，看看x_test，它看起来像这样：

每一列和每一行都有一个0，如果我继续向下滚动也是如此。这就是我感到困惑的地方。我也不确定如何查看原始图像以自己判断它们的预测效果。我最终希望自己在画图软件中画一个数字，然后看看模型是否能预测它，但为此我需要首先理解发生了什么。我觉得我已经很接近了，但我只需要一点推动！

回答：

我认为如果你阅读更多关于输入和输出层维度的内容，那将会有所帮助。

在你的例子中：输入层：一个图像的单个训练示例有两个维度28*28，然后转换为一个维度为784的单一向量。这作为神经网络的输入层。因此，对于m个训练示例，你的输入层将具有维度(m, 784)。类比来说（相对于传统的机器学习系统），你可以想象图像的每个像素都被转换成一个特征（或x1, x2, … x784），你的训练集是一个具有m行和784列的数据框，然后被输入到神经网络中以计算y_hat = f(x1,x2,x3,...x784)。

输出层：作为我们神经网络的输出，我们希望它预测这是从0到9中的哪个数字。因此，对于单个训练示例，输出层具有维度10，代表从0到9的每个数字，对于n个测试示例，输出层将是一个维度为n*10的矩阵。我们的y是一个长度为n的向量，将会是像[1,7,8,2,.....]这样的，包含每个测试示例的真实值。但为了匹配输出层的维度，y向量的维度使用独热编码进行转换。想象一个长度为10的向量，通过在第7个位置放置1，其余位置为零来表示数字7，像[0,0,0,0,0,0,1,0,0,0]这样的。

所以在你的问题中，如果你想查看原始图像，你应该能够在重塑训练示例之前看到它，像image(mnist$test$x[1, , ])这样的操作。

希望这对你有帮助！！

学技术

理解神经网络在文档示例（MNIST）中预测的内容

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复