文本挖掘和机器学习

我有一个包含单词和文本的数据集，我想通过K-means或其他无监督/有监督学习方法进行聚类，例如，将单词’John’分类为名字（并与其他人的名字聚类），将’brazil’分类为地点等…有没有我可以使用的模型来解决这个问题。我听说过N-grams，但不知道如何将Ngrams的概率绘制在x,y图上或类似的图上。
P.S. 如果您有任何例子，那将是非常棒的

回答：

word2vec和嵌入怎么样？
https://deeplearning4j.org/word2vec

学技术

文本挖掘和机器学习

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复