如何使用机器学习算法预测最受讨论的Twitter类别

我拥有的输入

我有一个包含以下2000个句子的csv文件:

我想做什么

我想:

  A) 对每个句子进行分类

我考虑的一种方法是创建一个字典,将每个类别的相关词汇放入其中,但我并不喜欢这种创建字典的想法,而是希望机器能够自己决定/预测。

有没有更好的实现方法?我如何在这里使用机器学习?

你能建议一个逐步的过程/代码/机器学习算法来进行训练吗?我有Python语言的经验。


回答:

这不一定是机器学习的一个好应用。基本上,你是在分析推文中的每个词,看看这个词是否属于预定义的类别。机器学习可能用于情感分析之类的事情,它可以“学习”单个词或词组传达某种感觉,但对单个词进行分类实际上并不合理。你将试图“训练”一个模型来学习词的定义。

我认为你使用字典的方法是可行的,而且更容易实现。对于你关心的每个类别,添加几个词,然后你可以使用同义词库API以编程方式查找每个类别中每个词的同义词,以扩展你的字典的词汇量。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注