数据挖掘和基于文本的模式识别

我正在开发一款软件,用于提取用户在Twitter个人资料上对某化妆品“XYZ”发表的评论和帖子的纯文本。我已经解析了从Twitter API接收到的JSON对象,并将原始数据存储在MySql数据库中。

现在,我需要分析这些纯文本,以提取关于化妆品“XYZ”的评论模式,判断是好评还是差评等,并将这些信息输入到一个单独的API中,用于在HTML中创建动态可视化图表。

我在数据挖掘和基于文本的模式识别领域完全是新手。如果有人能建议如何从数据库中的这些纯文本开始进行模式识别算法,并为我的单独可视化图表API提供数据,我将非常感激。


回答:

我强烈建议你观看以下斯坦福大学的NLP讲座,特别是:

  • 第3周 – 情感分析(这是你想要达到的目标)
  • 第4周 – 关系提取(Hearst模式等)
  • 我认为你会发现这些资源非常有价值。

    Related Posts

    使用LSTM在Python中预测未来值

    这段代码可以预测指定股票的当前日期之前的值,但不能预测…

    如何在gensim的word2vec模型中查找双词组的相似性

    我有一个word2vec模型,假设我使用的是googl…

    dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

    我试图使用 XGBoost 创建模型。 看起来我成功地…

    ML Tuning – Cross Validation in Spark

    我在https://spark.apache.org/…

    如何在React JS中使用fetch从REST API获取预测

    我正在开发一个应用程序,其中Flask REST AP…

    如何分析ML.NET中多类分类预测得分数组?

    我在ML.NET中创建了一个多类分类项目。该项目可以对…

    发表回复

    您的邮箱地址不会被公开。 必填项已用 * 标注