我在自然语言处理中有这样一个任务:训练一个分类器并将其导出为人类可读的格式。有什么最好的应用程序可以做到这一点吗?
我尝试使用NLTK,但它没有导出到人类可读格式的功能,例如
这是一个分类器
classifier = nltk.NaiveBayesClassifier.train(train_set)
我需要将其保存下来,以便稍后在不依赖NLTK的情况下使用
我知道有pickle技巧,但它并不是完全人类可读的。
有什么最好且方便的工具可以用来训练分类器并将其导出到文件中吗?
回答:
@xhudik 是正确的。贝叶斯将是一个黑盒算法,但如果我正确理解你的意图——你可能想了解某些词/特征输入的系数,为什么不直接遍历模型呢?即使使用朴素贝叶斯,你也可以检查分类器输出的可能性值,并将这些值序列化到文件中。
例如:你有3个类别:A、B和C
A B Cn1 -> .2 .6 .2n2 -> .5 .1 .4...