我读了很多文章,这些文章解释了在情感分析系统真正运作之前,需要有一组初始文本,这些文本被分类为“积极”或“消极”。
我的问题是:是否有人尝试过仅仅通过对比“积极”形容词和“消极”形容词,并考虑到简单的否定词来避免将“not happy”归类为积极?如果有的话,有没有文章讨论这种策略为什么不现实?
回答:
Peter Turney的一篇经典论文(2002年)解释了一种进行无监督情感分析(积极/消极分类)的方法,仅使用excellent和poor作为种子集。Turney利用这两个形容词与其他词的互信息达到了74%的准确率。