数据挖掘和基于文本的模式识别

我正在开发一款软件,用于提取用户在Twitter个人资料上对某化妆品“XYZ”发表的评论和帖子的纯文本。我已经解析了从Twitter API接收到的JSON对象,并将原始数据存储在MySql数据库中。

现在,我需要分析这些纯文本,以提取关于化妆品“XYZ”的评论模式,判断是好评还是差评等,并将这些信息输入到一个单独的API中,用于在HTML中创建动态可视化图表。

我在数据挖掘和基于文本的模式识别领域完全是新手。如果有人能建议如何从数据库中的这些纯文本开始进行模式识别算法,并为我的单独可视化图表API提供数据,我将非常感激。


回答:

我强烈建议你观看以下斯坦福大学的NLP讲座,特别是:

  • 第3周 – 情感分析(这是你想要达到的目标)
  • 第4周 – 关系提取(Hearst模式等)
  • 我认为你会发现这些资源非常有价值。

    Related Posts

    L1-L2正则化的不同系数

    我想对网络的权重同时应用L1和L2正则化。然而,我找不…

    使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

    我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

    f1_score metric in lightgbm

    我想使用自定义指标f1_score来训练一个lgb模型…

    通过相关系数矩阵进行特征选择

    我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

    可以将机器学习库用于流式输入和输出吗?

    已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

    在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

    我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

    发表回复

    您的邮箱地址不会被公开。 必填项已用 * 标注