MAXent分类器NLTK输出理解

我正在尝试理解MAXent分类器的classifier.show_most_informative_features(10)。我无法理解列的含义,例如在以下输出中:

train on 460 instances, test on 154 instances accuracy: 0.61038961039 pos precision: 0.432989690722 pos recall: 0.893617021277 neg precision: 0.912280701754 neg recall: 0.485981308411    -4.141 need==True and label is 'REL'    3.395 approves==True and label is 'IRREL'   -3.308 took==True and label is 'IRREL' -1.766 treat==True and label is 'REL' -1.488 tired==True and label is 'IRREL' -1.295 gave==True and label is 'IRREL' 0.879 need==True and label is 'IRREL' 

回答:

看起来你有两个标签,"RELEVANT""IRRELEVANT"。当有两个标签时,一个通常被命名为“1”或正类,另一个被命名为“-1”或负类。

在训练过程中,分类器分析了460个训练实例的特征,并根据它们区分两个标签的能力对其进行加权。加权过程的细节取决于你选择的算法。

正类精确度:在154个测试实例中,被分类为标签1的实例中有43%确实是标签1。

正类召回率:测试集中89%的标签1实例被找到,即被分类为标签1。

负类精确度 / 负类召回率与此类似,但适用于标签-1。

准确率:154个测试实例中有61%被正确标记。

特征是根据它们的绝对值排序的,这对应于它们对分类的相关性。在这种情况下,最“有帮助”的特征是need,如果它为真,这是一个非常好的提示,表明该实例的标签应该是“RELEVANT”。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注