我有一个500×2000的矩阵,其中每一行代表一个个体,每一列是关于该个体的某个特定质量的测量。我使用64的批量大小,因此网络每个周期的输入实际上是一个64×2000的矩阵。我试图在PyTorch中构建一个CNN来根据这些测量值对个体进行分类。然而,我在卷积层的参数设置上遇到了困难。
下面是我当前定义的一个简单卷积神经网络的代码。
class CNNnet(nn.Module) def __init__(self): self.conv1 = nn.Conv1d(2000, 200, (1,2), stride=10) self.pool = nn.MaxPool1d(kernel_size = (1, 2), stride = 2) self.fc1 = nn.Linear(64, 30) self.fc2 = nn.Linear(30, 7) def forward(self, x): x = x.view(64, 2000, 1) x = F.relu(self.conv1(x)) x = self.pool(x) x = F.relu(self.fc1(x)) x = self.fc2(x) return x
尝试训练这个模型会产生以下错误:
“RuntimeError: Expected 4-dimensional input for 4-dimensional weight 200 2000 1 2, but got 3-dimensional input of size [64, 2000, 1] instead”.
我对为什么它期望一个4D的200x2000x1x2矩阵感到困惑(输出通道数不应该与输入无关吗?而且为什么最后有一个2?)。
我的问题是,当处理一维数据时,编写CNN(特别是卷积层)的正确语法或方法是什么?任何帮助都将不胜感激。
回答:
所以在1维情况下,核大小只是一个向量。因此,如果你想要一个大小为‘1X2’的核,你需要指定‘2’。在2维情况下,2将意味着一个‘2X2’的核大小。
你提供了一个包含两个值的元组,所以你使用了两种核类型,每种类型都会创建自己的通道