Vader SentimentIntensityAnalyzer是否支持多语言?

我在进行情感分析时遇到了困难,发现Vader解决方案是我目前找到的最佳选择。我的问题是找不到任何关于如何使用非英语语言输入的文档。


回答:

简短的回答是“否”。

GitHub页面上的README文件中提到

如果你有互联网访问权限,演示中有一个例子展示了VADER如何分析其他语言(非英语文本句子)的情感。

但是如果你仔细查看这个演示的实际操作(在当前版本的vaderSentiment.py文件的第552行开始),你会发现这是完全基于使用机器翻译网络服务将文本自动翻译成英语来实现的。因此,结果不仅依赖于情感分析工具的准确性,还依赖于你用来创建英文版本输入的翻译工具的准确性。

Vader仅对英语文本进行情感分析,但这种变通方法(自动翻译)可能是一个可行的选项。情感分析对常见的机器翻译问题不太敏感,但如果你选择使用这种变通方法,仍然需要牢记其局限性。

*举个例子,演示中使用的服务将“Das Internet funktioniert heute nicht. Ist eine Störung bekannt?”翻译为“The Internet was not working today. Is a disorder known?”,更准确的翻译应该是“The internet isn’t working today. Is a disruption known?”。第一句话的时态翻译错误了,虽然在这个语境中有几个合法的“Störung”翻译,但“disorder”是最不恰当的选择。尽管如此,虽然这使得整体翻译质量很差,但这些错误不太可能显著影响情感分析的结果。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注