我正在尝试进行序列到序列的预测。为此,我使用了一个 LSTM 层 followed by a fully connected layer。在训练阶段,我采用了教师训练法,而在测试阶段我想跳过这一步(我可能在这里理解错了)。我没有找到直接的方法来实现这一点,所以我采用了下面的方法。
def forward(self, inputs, future=0, teacher_force_ratio=0.2, target=None): outputs = [] for idx in range(future): rnn_out, _ = self.rnn(inputs) output = self.fc1(rnn_out) if self.teacher_training: new_input = output if np.random.random() >= teacher_force_ratio else target[idx] else: new_input = output inputs = new_input
我使用了一个 bool
类型的变量 teacher_training
来检查是否需要教师训练。这么做对吗?如果是,还有没有更好的方法?谢谢。
回答:
在 PyTorch 中,所有扩展自 nn.Module
的类都有一个名为 training
的布尔类型关键字参数。因此,我们应该直接使用 training
参数,而不是 teacher_training
。这个参数会根据模型的训练模式自动设置(model.train()
和 model.eval()
)。