识别负面数据集中积极性和消极性

首先，我想让大家知道，我对机器学习（ML）还是一个新手。我正在进行一个项目，检测一组词语的积极性或消极性，因此我创建了一个包含可能的负面词语的数据库。这样，机器学习就可以对整个词语集的整体分数进行预测，判断其积极性或消极性。我的问题是，仅使用数据集中负面词语，是否有可能分类出积极词语？如果可能的话，这样做会不会影响预测的准确性？

回答：

不，这通常是不可能的。模型将无法区分（1）新的负面短语；（2）中性短语；（3）积极短语。事实上，仅有负面短语，模型将很难学习到“坏”和“还不错”是相反的，因为它在负面文献中已经见过了很多“不是”的例子，比如“即使免费也不值得一看”。

学技术

识别负面数据集中积极性和消极性

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复