我有一个包含单词和文本的数据集,我想通过K-means或其他无监督/有监督学习方法进行聚类,例如,将单词’John’分类为名字(并与其他人的名字聚类),将’brazil’分类为地点等…有没有我可以使用的模型来解决这个问题。我听说过N-grams,但不知道如何将Ngrams的概率绘制在x,y图上或类似的图上。
P.S. 如果您有任何例子,那将是非常棒的
回答:
word2vec和嵌入怎么样?
https://deeplearning4j.org/word2vec
我有一个包含单词和文本的数据集,我想通过K-means或其他无监督/有监督学习方法进行聚类,例如,将单词’John’分类为名字(并与其他人的名字聚类),将’brazil’分类为地点等…有没有我可以使用的模型来解决这个问题。我听说过N-grams,但不知道如何将Ngrams的概率绘制在x,y图上或类似的图上。
P.S. 如果您有任何例子,那将是非常棒的
回答:
word2vec和嵌入怎么样?
https://deeplearning4j.org/word2vec