如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

如何在Python的tokenizers库中设置词汇大小?

我想训练我自己的分词器,并进一步将其用于预训练模型。然…

提升Python算法速度

我使用了Sentiment140数据集进行Twitte…

在大型文本语料库中查找给定术语列表中最相似的术语

已关闭。 此问题不符合 Stack Overflow …

使用Sentence-Bert与scikit-learn中的其他功能

我有一个数据集,其中一个特征是文本,另外还有4个特征。…

y应该是一维数组,但得到的是形状为()的数组

我已经训练并保存了一个模型。我试图在新数据上进一步训练…

如何使用不同特征作为输入的两个模型进行集成学习?

我有一个假新闻检测问题,通过向量化’twe…

为什么Gensim的FastText模型比Facebook的原生FastText模型更小?

看起来Gensim在FastText中的实现导致模型大…

ValueError: 输入特征数为12,而模型训练时使用的特征数为2494

我使用count_vectorizer、Tfidf_t…

如何查看独热编码的类别名称?

我有一个CSV文件,其中包含两列:推文的“文本”和它的…

Gensim FastText 获取词汇表或词索引

尝试使用 gensim’s fasttext,测试来自…

Spacy-Transformers: 访问GPT-2?

我正在使用Spacy-Transformers来构建一…

NLP工作流程

在NLP中,我应该在train_test_split之…

AttributeError: 在 DataLoader 工作进程 0 中捕获到 AttributeError。 – 微调预训练的变换器模型

谁能帮我解决这个错误? —————…

如何从字符串中去除不必要的词以提高搜索效果

已关闭。此问题需要详细信息或澄清。目前不接受回答。 想…

如何在使用自定义数据集进行微调后检查混淆矩阵?

这个问题与如何在使用自定义数据集进行微调后检查混淆矩阵…

BERT在意大利语上下文/语义搜索中的问题

我在意大利语上下文搜索中使用BERT模型,但它无法理解…

如何使用FastText查找相似句子(包含生僻词的句子)

我正在尝试创建一个NLP模型,能够查找相似句子。例如,…

在将Linear SVC模型应用于测试集时,我遇到了ValueError: X has 5851 features per sample; expecting 2754

我在尝试使用Linear SVC对文本进行分类时遇到了…

使用spaCy构建自定义模型时遇到错误

问题 根据官方指南,我试图添加一个额外的训练数据集,并…

使用字符偏移量将已知匹配添加到Spacy文档

我想使用不同的Spacy工具对文档进行一些分析,尤其是…

使用huggingface transformers进行多次训练,除了第一次之外,结果将完全相同

我有一个函数,它会从huggingface加载预训练模…

如何将pandas的多个文本列转换为张量?

您好,我正在处理由IBM分享的关键点分析任务,这是链接…

在Node.js中预加载Python库

我有一个Web应用,前端使用JavaScript,后端…

任何人有办法将一段文字分词,将每句话放入pandas数据框,并对每句话进行情感分析吗?

初学者级别的NLP/Python程序员。标题已经说明了…