我正在尝试编写一个程序,该程序以文本(文章)作为输入,并输出该文本的情感极性,是正面还是负面。我已经广泛阅读了不同的方法,但仍然感到困惑。我读到了许多技术,如分类器和机器学习。我希望得到指导和明确的指示,告诉我从哪里开始。例如,我有一个分类器需要数据集,但我如何将文本(文章)转换为分类器的数据集。如果有人能告诉我解决这个问题的逻辑顺序,那将非常好。提前感谢!附注:请提及任何相关的算法或开源实现
此致,Mike
回答:
如果你使用Python,我建议你看看NLTK和NLTK书籍。
这个博客:streamhacker.com有一些非常好的文章可以帮助你入门。
自2000年代末以来,这个领域已经进行了大量的研究。
更新(2013年10月):
斯坦福的研究人员在情感分析方面取得了突破,平均准确率超过85%。(http://gigaom.com/2013/10/03/stanford-researchers-to-open-source-model-they-say-has-nailed-sentiment-analysis/)