我通过以下步骤(概括)使用Keras库训练了一个情感分类模型。
- 使用Tokenizer对象/类将文本语料库转换为序列
- 使用model.fit()方法构建模型
- 评估该模型
现在,为了使用这个模型进行评分,我能够将模型保存到文件并从文件中加载。然而,我还没有找到将Tokenizer对象保存到文件的方法。如果没有这个,每次我需要评分哪怕只是一句话时,都必须处理整个语料库。有没有解决这个问题的办法?
回答:
最常见的方法是使用pickle
或joblib
。这里有一个使用pickle
保存Tokenizer
的示例:
import pickle# savingwith open('tokenizer.pickle', 'wb') as handle: pickle.dump(tokenizer, handle, protocol=pickle.HIGHEST_PROTOCOL)# loadingwith open('tokenizer.pickle', 'rb') as handle: tokenizer = pickle.load(handle)