Home IT技术 Keras文本预处理 – 将Tokenizer对象保存到文件以进行评分

Keras文本预处理 – 将Tokenizer对象保存到文件以进行评分

IT技术 xiaolong · 2025年4月13日 · 0 Comment

我通过以下步骤（概括）使用Keras库训练了一个情感分类模型。

使用Tokenizer对象/类将文本语料库转换为序列
使用model.fit()方法构建模型
评估该模型

现在，为了使用这个模型进行评分，我能够将模型保存到文件并从文件中加载。然而，我还没有找到将Tokenizer对象保存到文件的方法。如果没有这个，每次我需要评分哪怕只是一句话时，都必须处理整个语料库。有没有解决这个问题的办法？

回答：

最常见的方法是使用pickle或joblib。这里有一个使用pickle保存Tokenizer的示例：

import pickle# savingwith open('tokenizer.pickle', 'wb') as handle:    pickle.dump(tokenizer, handle, protocol=pickle.HIGHEST_PROTOCOL)# loadingwith open('tokenizer.pickle', 'rb') as handle:    tokenizer = pickle.load(handle)

deep-learning keras machine-learning neural-network nlp

发表回复取消回复