MAXent分类器NLTK输出理解

我正在尝试理解MAXent分类器的classifier.show_most_informative_features(10)。我无法理解列的含义，例如在以下输出中：

train on 460 instances, test on 154 instances accuracy: 0.61038961039 pos precision: 0.432989690722 pos recall: 0.893617021277 neg precision: 0.912280701754 neg recall: 0.485981308411    -4.141 need==True and label is 'REL'    3.395 approves==True and label is 'IRREL'   -3.308 took==True and label is 'IRREL' -1.766 treat==True and label is 'REL' -1.488 tired==True and label is 'IRREL' -1.295 gave==True and label is 'IRREL' 0.879 need==True and label is 'IRREL'

回答：

看起来你有两个标签，"RELEVANT"和"IRRELEVANT"。当有两个标签时，一个通常被命名为“1”或正类，另一个被命名为“-1”或负类。

在训练过程中，分类器分析了460个训练实例的特征，并根据它们区分两个标签的能力对其进行加权。加权过程的细节取决于你选择的算法。

正类精确度：在154个测试实例中，被分类为标签1的实例中有43%确实是标签1。

正类召回率：测试集中89%的标签1实例被找到，即被分类为标签1。

负类精确度 / 负类召回率与此类似，但适用于标签-1。

准确率：154个测试实例中有61%被正确标记。

特征是根据它们的绝对值排序的，这对应于它们对分类的相关性。在这种情况下，最“有帮助”的特征是need，如果它为真，这是一个非常好的提示，表明该实例的标签应该是“RELEVANT”。

学技术

MAXent分类器NLTK输出理解

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复