重新训练和更新现有的Rasa NLU模型

我在一个项目中使用了Rasa NLU,该项目涉及到对结构化文本的理解。我的用例需要通过添加新的文本语料实体示例来不断更新我的训练集。然而,这意味着我必须每隔几天重新训练我的模型,由于训练集规模的增加,这需要更多的时间。

在Rasa NLU中,有没有一种方法可以仅使用新的训练集数据来更新已经训练好的模型,而不需要使用整个之前的训练数据集和新的训练数据集来重新训练整个模型?

我正在寻找一种方法,可以通过每隔几天用增量的新训练数据集来简单地更新我现有的已训练模型。


回答:

截至目前,关于此主题的最新Github 问题指出,无法仅通过添加新的语句来重新训练模型。在之前引用的问题中也是如此。

你说的对:定期使用越来越长的文件进行重新训练会变得越来越耗时。尽管如此,在生产环境中就地重新训练并不是一个好主意。

用户评论中的一个绝佳示例:

在同一模型上重新训练可能会给生产系统带来问题。我曾经覆盖我的模型,但在某个时候,一次训练没有完美工作,我开始看到我的响应置信度严重下降。我不得不找出问题来自哪里并重新训练模型。

持续训练新模型(带时间戳)是好的,因为这使得回滚更容易(生产系统中会发生这种情况)。然后我从数据库中获取最新的模型名称。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注