我已经使用Fastai成功地对语言模型进行了微调。我希望从这个微调后的模型中提取句子嵌入,以便进行句子相似度比较。我该如何获取编码器模型的嵌入?另外,这些嵌入是否可以像其他模型(如USE)的嵌入一样通过点积进行比较?
data_lm = TextLMDataBunch.from_df(train_df = se1, valid_df = se2, path = "",text_cols='text')learn = language_model_learner(data_lm,drop_mult=0.7,pretrained=True,arch=AWD_LSTM)learn.fit_one_cycle(3, 1e-01)
我的代码如上所示,我如何从learn中获取编码?
回答:
这应该可以让你获取编码器(这是一个嵌入层):
learn.model[0].encoder