情感分析的训练数据

在企业领域,我可以在哪里找到已经分类为正面/负面的情感文档语料库?我想要一个包含公司评论的大型文档语料库,比如分析师和媒体提供的公司评论。

我找到了关于产品和电影的评论语料库。是否有针对商业领域的语料库,包括公司评论,并且符合商业语言的表达方式?


回答:

http://www.cs.cornell.edu/home/llee/data/

http://mpqa.cs.pitt.edu/corpora/mpqa_corpus

您可以使用Twitter及其表情符号,像这样:http://web.archive.org/web/20111119181304/http://deepthoughtinc.com/wp-content/uploads/2011/01/Twitter-as-a-Corpus-for-Sentiment-Analysis-and-Opinion-Mining.pdf

希望这些能帮助您起步。如果您对特定的子任务感兴趣,如否定、情感范围等,文献中还有更多内容。

为了专注于公司,您可以将方法与主题检测结合,或者简单地使用大量提及特定公司的文本。或者,您可以让Mechanical Turkers来标注您的数据。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注