nlp – 学技术

IT技术

如何在gensim的word2vec模型中查找双词组的相似性

xiaolong · 2025年6月1日 · 0 Comment

我有一个word2vec模型，假设我使用的是googl…

IT技术

如何在Python的tokenizers库中设置词汇大小？

xiaolong · 2025年6月1日 · 0 Comment

我想训练我自己的分词器，并进一步将其用于预训练模型。然…

IT技术

提升Python算法速度

xiaolong · 2025年6月1日 · 0 Comment

我使用了Sentiment140数据集进行Twitte…

IT技术

在大型文本语料库中查找给定术语列表中最相似的术语

xiaolong · 2025年6月1日 · 0 Comment

已关闭。此问题不符合 Stack Overflow …

IT技术

使用Sentence-Bert与scikit-learn中的其他功能

xiaolong · 2025年6月1日 · 0 Comment

我有一个数据集，其中一个特征是文本，另外还有4个特征。…

IT技术

y应该是一维数组，但得到的是形状为()的数组

xiaolong · 2025年6月1日 · 0 Comment

我已经训练并保存了一个模型。我试图在新数据上进一步训练…

IT技术

如何使用不同特征作为输入的两个模型进行集成学习？

xiaolong · 2025年6月1日 · 0 Comment

我有一个假新闻检测问题，通过向量化’twe…

IT技术

为什么Gensim的FastText模型比Facebook的原生FastText模型更小？

xiaolong · 2025年6月1日 · 0 Comment

看起来Gensim在FastText中的实现导致模型大…

IT技术

ValueError: 输入特征数为12，而模型训练时使用的特征数为2494

xiaolong · 2025年6月1日 · 0 Comment

我使用count_vectorizer、Tfidf_t…

IT技术

如何查看独热编码的类别名称？

xiaolong · 2025年6月1日 · 0 Comment

我有一个CSV文件，其中包含两列：推文的“文本”和它的…

IT技术

Gensim FastText 获取词汇表或词索引

xiaolong · 2025年6月1日 · 0 Comment

尝试使用 gensim’s fasttext，测试来自…

IT技术

Spacy-Transformers: 访问GPT-2？

xiaolong · 2025年6月1日 · 0 Comment

我正在使用Spacy-Transformers来构建一…

IT技术

NLP工作流程

xiaolong · 2025年6月1日 · 0 Comment

在NLP中，我应该在train_test_split之…

IT技术

AttributeError: 在 DataLoader 工作进程 0 中捕获到 AttributeError。 – 微调预训练的变换器模型

xiaolong · 2025年5月31日 · 0 Comment

谁能帮我解决这个错误？ —————…

IT技术

如何从字符串中去除不必要的词以提高搜索效果

xiaolong · 2025年5月31日 · 0 Comment

已关闭。此问题需要详细信息或澄清。目前不接受回答。想…

IT技术

如何在使用自定义数据集进行微调后检查混淆矩阵？

xiaolong · 2025年5月31日 · 0 Comment

这个问题与如何在使用自定义数据集进行微调后检查混淆矩阵…

IT技术

BERT在意大利语上下文/语义搜索中的问题

xiaolong · 2025年5月31日 · 0 Comment

我在意大利语上下文搜索中使用BERT模型，但它无法理解…

IT技术

如何使用FastText查找相似句子（包含生僻词的句子）

xiaolong · 2025年5月31日 · 0 Comment

我正在尝试创建一个NLP模型，能够查找相似句子。例如，…

IT技术

在将Linear SVC模型应用于测试集时，我遇到了ValueError: X has 5851 features per sample; expecting 2754

xiaolong · 2025年5月31日 · 0 Comment

我在尝试使用Linear SVC对文本进行分类时遇到了…

IT技术

使用spaCy构建自定义模型时遇到错误

xiaolong · 2025年5月31日 · 0 Comment

问题根据官方指南，我试图添加一个额外的训练数据集，并…

IT技术

使用字符偏移量将已知匹配添加到Spacy文档

xiaolong · 2025年5月31日 · 0 Comment

我想使用不同的Spacy工具对文档进行一些分析，尤其是…

IT技术

使用huggingface transformers进行多次训练，除了第一次之外，结果将完全相同

xiaolong · 2025年5月31日 · 0 Comment

我有一个函数，它会从huggingface加载预训练模…

IT技术

如何将pandas的多个文本列转换为张量？

xiaolong · 2025年5月31日 · 0 Comment

您好，我正在处理由IBM分享的关键点分析任务，这是链接…

IT技术

在Node.js中预加载Python库

xiaolong · 2025年5月31日 · 0 Comment

我有一个Web应用，前端使用JavaScript，后端…

IT技术

任何人有办法将一段文字分词，将每句话放入pandas数据框，并对每句话进行情感分析吗？

xiaolong · 2025年5月31日 · 0 Comment

初学者级别的NLP/Python程序员。标题已经说明了…