我们可以使用以下代码在fasttext中训练一个监督模型:
import fasttext
model = fasttext.train_supervised(input="cooking.train")
我的问题是它是如何表示特征的(词袋模型、tf/idf还是词嵌入),以及它使用什么算法进行文本分类?
回答:
它仍然在为输入文本学习词向量 – 但随后将它们全部平均,就像一个无限窗口的CBOW模式 – 然后使用这些来预测标签,就好像标签是(word2vec风格的)预测词一样。
我们可以使用以下代码在fasttext中训练一个监督模型:
import fasttext
model = fasttext.train_supervised(input="cooking.train")
我的问题是它是如何表示特征的(词袋模型、tf/idf还是词嵌入),以及它使用什么算法进行文本分类?
回答:
它仍然在为输入文本学习词向量 – 但随后将它们全部平均,就像一个无限窗口的CBOW模式 – 然后使用这些来预测标签,就好像标签是(word2vec风格的)预测词一样。