Home IT技术为什么torch.nn.Conv2d在使用'(n, n)’和’n’参数时结果不同？

为什么torch.nn.Conv2d在使用'(n, n)’和’n’参数时结果不同？

IT技术 xiaolong · 2025年5月31日 · 0 Comment

input = torch.randn(8, 3, 50, 100)m = nn.Conv2d(3, 3, kernel_size=(3, 3), padding=(1, 1))m2 = nn.Conv2d(3, 3, kernel_size=3, padding=1)output = m(input)output2 = m2(input)torch.equal(output, output2) >> False

我认为上面m和m2的Conv2d应该有完全相同的输出值，但实际上并非如此，原因是什么？

回答：

您确实初始化了两个具有相同设置的nn.Conv2d。然而，权重的初始化是随机进行的！这里您有两个不同的层m和m2。具体来说，m.weight和m2.weight的组件不同，m.bias和m2.bias也是如此。

要获得相同的结果，一种方法是复制模型的基础参数：

>>> m.weight = m2.weight>>> m.bias = m2.bias

这样，当然会导致torch.equal(m(input), m2(input))为True。

conv-neural-network deep-learning machine-learning pytorch

发表回复取消回复