我正在使用pycrfsuite(BIO标记)和nltk创建一个序列标记程序。这个程序应该能够处理不同上下文的查询。
我为每个上下文训练了不同的模型,并分别保存,例如一个模型处理航班预订查询,另一个模型处理发送短信的查询等。
我有一个界面,用户可以输入来自任何上下文的查询。有人能建议我除了遍历每个模型之外,找到并使用特定查询的相应模型的最佳方法吗?还是我对使用不同模型的做法完全错了?
回答:
传统上解决这个问题的办法是使用“意图”分类器来确定查询的意图。这个分类器被训练用来将查询路由到适当的序列模型。然后,你可以将查询发送到意图分类器预测的前三个模型,看看其中哪些能给出合理的结果。