拆分Pytorch模型是否能降低内存使用？

假设我有一个定义为下面的Pytorch自编码器模型：

class ae(torch.nn.Module):   def __init__(self, z_dim, n_channel=3, size_=8):       super(ae, self).__init__()       self.encoder = Encoder()       self.decoder = Decoder()   def forward(self, x):       z = self.encoder(x)       x_reconstructed = self.decoder(z)       return z, x_reconstructe

现在，我不是定义一个特定的ae模型并加载它，而是直接在我的代码中使用Encoder和Decoder的代码。我知道总参数的数量不会改变，但我的问题是：由于这两个模型现在是分开的，是否有可能代码可以在更低的RAM/GPU内存下运行？将它们分开是否意味着它们不需要一次性加载到内存中？

（请注意，自编码器只是一个例子，我的真正问题是关于任何由多个子模块组成的模型）。

回答：

代码是否有可能在更低的RAM/GPU内存下运行？

以你当前的方式创建它，不可能。如果你实例化它并移动到设备上，类似这样的操作：

encoder = ...decoder = ...autoencoder = ae(encoder, decoder).to("cuda")

当移动到设备上时，它总共将占用decoder + encoder的GPU内存，并且会一次性加载到内存中。

但是，你可以这样做：

inputs = ...inputs = inputs.to("cuda")encoder = ...encoder.to("cuda")output = encoder(inputs)encoder.to("cpu")  # 释放GPU内存decoder = ...decoder.to("cuda")  # 总体上使用较少result = decoder(output)

你可以将这个想法包装在模型（或函数）中，但仍然需要等待网络的部分被复制到GPU上，你的性能会较差（但GPU内存会更小）。

根据你在哪里实例化模型，RAM内存占用也可能更低（Python会自动销毁函数作用域内的对象），让我们看看这个选项（不需要转换为cpu，因为如上所述，对象会自动被垃圾回收）：

def encode(inputs):    encoder = ...    encoder.to("cuda")    results = encoder(inputs)    return resultsdef decode(inputs):    decoder = ...    decoder.to("cuda")    return decoder(inputs)outputs = encode(inputs)result = decode(outputs)

学技术

拆分Pytorch模型是否能降低内存使用？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复