我需要开发一个基于自动学习的文本反馈分析系统,用于一系列在线课程,类似于Coursera、EdX等常见的MOOCs。可以使用哪些Java/Python工具/服务?该系统应该能够扫描句子并理解其含义。例如:
输入:“这门课程非常有信息量。”
输出:设置课程观察到的正面反馈标志。
输入:”讲师的语言技能很差。”
输出:设置讲师观察到的负面反馈标志。
输入:”课程材料不够充分。”
输出:设置课程观察到的负面反馈标志。
回答:
这个问题非常宽泛。以下是一些开始的链接。http://nlp.stanford.edu/software/corenlp.shtml 使用Socher等人开发的情感模型,可以直接进行情感评分。
Python的NLTK也是一个很好的起点。这里有一篇博客文章,介绍如何使用它来构建情感分析器:http://www.laurentluce.com/posts/twitter-sentiment-analysis-using-python-and-nltk/
此外,TextBlob(也是Python的)有一个预训练的情感分类器:http://textblob.readthedocs.org/en/latest/quickstart.html