我有一个使用gensim中的doc2vec
的应用程序。我知道KeyedVector
现在是推荐的方法,我正在尝试移植,但是我不确定Doc2Vec
中的infer_vector
方法的等效方法是什么?
或者更好的说法是,如何使用KeyedVector
模型获取整个文档的文档向量,并将其写入我的Annoy模型?
回答:
KeyedVectors
并不替代Doc2Vec
,它是词向量的存储和索引系统:
词向量的存储和相似度查找。该代码独立于向量训练方式(Word2Vec, FastText, WordRank, VarEmbed等)
在这个类中,词向量被视为只读的。
这个类对标记文档一无所知,也无法实现infer_vector
或其等效方法,因为这个过程需要训练,而KeyedVectors
的理念是抽象出训练方法。