在使用OpenNLP解析和标记词语时,我对标签(例如S、NP、VP、ADJP)的具体含义产生了疑问。我通过网络搜索找到了一些解释,但仍有一些标签的含义未能找到。目前我的代码输出如下:
The movie was really good\-S - S |-NP - {Unknown} | |-DT - Determiner | | \- The - The | \- NN - Noun, Singular or mass | \- movie - movie \-VP - {Unknown} |-VBD - Verb, past tense | \- was - was \- ADJP - {Unknown} |-RB - Adverb | \-really - really \-JJ - Adjective \- good - good
如您所见,我已经成功将一些标签映射为相应的含义,例如将NN映射为“名词,单数或不可数”,但我无法找到关于S、NP、VP、ADJP的任何参考资料。
提前感谢您的帮助。
回答:
这些标签是词性标签或句法类别。
- S : 句子
- NP : 名词短语
- VP : 动词短语
- ADJP : 形容词短语
这里有一个列表,列出了OpenNLP使用的Penn Treebank语料库中的标签。不同的项目对词性的缩写使用不同。例如,一些项目使用NP表示名词短语,而其他项目则使用NNP。