Home IT技术 词嵌入处理词汇表外词 词嵌入处理词汇表外词 IT技术 xiaolong · 2025年4月14日 · 0 Comment 我已经从语料库中生成了词向量,但是对于许多词汇表外的词出现了问题。如何利用现有的词嵌入动态生成这些词的词向量? 回答: 这是一个非常晚的回答(甚至不是你所寻找的答案),但在使用skip-gram模型时,你所要求的几乎是不可能的,因为每个词本身就是一个独立的实体。 你所要求的功能可以直接通过FastText实现。它利用n-gram来生成词汇表外词的词向量。 Gensim 提供了一个高级的API来使用 FastText。 相关文章: 从gensim word2Vec获取权重矩阵 为文档加载预训练的word2vec模型 如何使用已训练的模型创建新模型? 使用word2vec对词语进行分类 Word2Vec模型中有隐藏层吗? ### 理解Word2Vec的Skip-Gram结构和输出 如何将词向量拼接成句向量 我应该使用word2vec来进行词嵌入,包括测试数据吗? 神经网络中的投影层是什么? Doc2Vec适合情感分析吗? gensim machine-learning nlp word2vec