使用Pytorch实现LeNet

如果这个问题非常基础，我深表歉意。我觉得网上有很多资源，但大多数都是不完整的，或者跳过了我想了解的细节。

我正在尝试用Pytorch练习实现LeNet。

https://pytorch.org/tutorials/beginner/blitz/neural_networks_tutorial.html

为什么在这个例子以及许多在线例子中，他们在init中定义卷积层和全连接层，但在forward中定义子采样和激活函数？
使用torch.nn.functional进行某些函数的目的是什么，而使用torch.nn进行其他函数？例如，你可以使用torch.nn进行卷积（https://pytorch.org/docs/stable/nn.html#conv1d）和使用torch.nn.functional进行卷积（https://pytorch.org/docs/stable/nn.functional.html#conv1d）。为什么选择一个而不是另一个？
假设我想尝试不同的图像尺寸，比如28×28（MNIST）。教程建议我调整MNIST的大小。有没有办法改动LeNet的值？如果我不改动会发生什么？
num_flat_features的目的是什么？如果你想平展特征，你不能简单地使用x = x.view(-1, 16*5*5)吗？

回答：

为什么在这个例子以及许多在线例子中，他们在init中定义卷积层和全连接层，但在forward中定义子采样和激活函数？

任何具有可训练参数的层都应该在__init__中定义。子采样、某些激活函数、dropout等没有可训练参数，因此可以在__init__中定义，或者在forward期间通过torch.nn.functional接口直接使用。

使用torch.nn.functional进行某些函数的目的是什么，而使用torch.nn进行其他函数？

torch.nn.functional函数是大多数torch.nn层核心使用的实际函数，它们调用C++编译的代码。例如，nn.Conv2d是nn.Module的子类，任何包含可训练参数的自定义层或模型都应如此。这个类负责注册参数并封装训练和测试所需的其他必要功能。在forward期间，它实际上使用nn.functional.conv2d来应用卷积操作。正如第一个问题中提到的，当执行无参数操作如ReLU时，使用nn.ReLU类和nn.functional.relu函数之间实际上没有区别。

提供它们的理由是它们提供了一些自由度来做一些非常规的事情。例如，在这个答案中，我前几天写的，如果没有nn.functional.conv2d，提供解决方案会很困难。

假设我想尝试不同的图像尺寸，比如28×28（MNIST）。教程建议我调整MNIST的大小。有没有办法改动LeNet的值？如果我不改动会发生什么？

没有明显的方法可以改变现有的、已训练的模型以支持不同的图像尺寸。线性层的输入大小必须是固定的，并且在模型的那个点上的特征数量通常由网络的输入大小决定。如果输入的大小与模型设计的大小不同，那么当数据进入线性层时，它将具有错误的元素数量，程序将会崩溃。一些模型可以处理一系列的输入大小，通常是通过在线性层之前使用nn.AdaptiveAvgPool2d层来确保线性层的输入形状始终相同。即便如此，如果输入图像尺寸太小，那么网络中的下采样和/或池化操作将导致特征图在某一点消失，导致程序崩溃。

num_flat_features的目的是什么？如果你想平展特征，你不能简单地使用x = x.view(-1, 16*5*5)吗？

当你定义线性层时，你需要告诉它权重矩阵的大小。线性层的权重只是一个不受约束的矩阵（和偏置向量）。因此，权重矩阵的形状是由输入形状决定的，但你在运行forward之前并不知道输入形状，所以在初始化模型时需要提供一个额外的参数（或硬编码）。

回到实际的问题。是的，在forward期间，你可以简单地使用

x = x.view(-1, 16*5*5)

更好的是，使用

x = torch.flatten(x, start_dim=1)

这个教程是在.flatten函数添加到库中之前编写的。作者实际上只是编写了自己的平展功能，可以不论x的形状如何使用。这可能是为了让你有一些可以在模型中使用的可移植代码，而无需硬编码大小。从编程的角度来看，泛化这些东西是好的，因为这意味着如果你决定更改模型的一部分，你不必担心更改那些魔法数字（尽管这种关注似乎没有扩展到初始化）。

学技术

使用Pytorch实现LeNet

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复