nlp – 第 2 页 – 学技术

IT技术

如何使用fuzzywuzzy从列表中提取完整文本？

xiaolong · 2025年5月31日 · 0 Comment

以下是我的代码： from fuzzywuzzy im…

IT技术

使用句子变换器/ Pytorch 正确编码大量文档的方法是什么？

xiaolong · 2025年5月31日 · 0 Comment

我在使用sentence_transformers库编…

IT技术

如何合并两个CountVectorizer以处理重复项？

xiaolong · 2025年5月31日 · 0 Comment

考虑这个简单的例子 data = pd.DataFra…

IT技术

XGBClassifier ValueError: 操作数无法一起广播，形状为(2557,) (8,) (2557,)

xiaolong · 2025年5月31日 · 0 Comment

我正在进行一个文本分类项目。在探索不同的分类器时，我…

IT技术

如何使用spacy train向现有自定义NER模型添加实体？（Spacy v3.0）

xiaolong · 2025年5月31日 · 0 Comment

我目前正在实现一个自定义NER模型接口，用户可以通过前…

IT技术

### 朴素高斯预测概率仅返回0或1

xiaolong · 2025年5月31日 · 0 Comment

我训练了scikit-learn中的GaussianN…

IT技术

在Python中使用AllenNLP进行共指消解的代码是否存在？

xiaolong · 2025年5月31日 · 0 Comment

在Python中使用AllenNLP进行共指消解的代码…

IT技术

使用带有实体标尺和命名实体识别管道的预训练自定义模型时出现Spacy错误

xiaolong · 2025年5月31日 · 0 Comment

我使用了一个带有Gensim自定义词向量的spacy空…

IT技术

如何访问FastText分类器管道？

xiaolong · 2025年5月31日 · 0 Comment

众所周知，Facebook的FastText是一个出色…

IT技术

如何在Python中使用训练好的模型测试新句子 (sklearn)

xiaolong · 2025年5月31日 · 0 Comment

我有用于多类文本分类的训练模型代码，并且它运行正常，但…

IT技术

ValueError: 发现输入变量的样本数不一致：[6, 80]

xiaolong · 2025年5月31日 · 0 Comment

我在处理下面的代码时遇到了问题（这是imblearn管…

IT技术

如何使用FeatureUnion构建参数网格？

xiaolong · 2025年5月31日 · 0 Comment

我正在尝试运行一个结合了文本和数值特征的模型，但遇到了…

IT技术

如何使用FeatureUnion和Pipeline正确构建包含文本和数值数据的SGDClassifier？

xiaolong · 2025年5月31日 · 0 Comment

我有一个特征数据框（DF），看起来像这样：文本数字…

IT技术

将word2vec模型应用于具有数据框结构的训练集

xiaolong · 2025年5月31日 · 0 Comment

已关闭。此问题需要更加聚焦。目前不接受回答。想要改进…

IT技术

理解pytrec_eval中nDCG格式的问题？

xiaolong · 2025年5月31日 · 0 Comment

我正在使用pytrec_eval来计算nDCG分数。例…

IT技术

IndexError: 列表索引超出范围, NLP BERT Tensorflow

xiaolong · 2025年5月31日 · 0 Comment

我使用了Bert模型进行了训练并保存为hdf5文件，但…

IT技术

如何加快Fasttext的get_nearest_neighbors()函数运行速度？

xiaolong · 2025年5月31日 · 0 Comment

我在尝试使用Fasttext提取僧伽罗语中的形态/相似…

IT技术

文本（余弦）相似度

xiaolong · 2025年5月31日 · 0 Comment

我按照Fred Foo在Stack Overflow上…

IT技术

如何处理词袋模型中的词汇表外单词

xiaolong · 2025年5月31日 · 0 Comment

我在处理基于文本的数据集时尝试使用词袋模型（BoW）进…

IT技术

用于比较两个向量进行分类的损失函数

xiaolong · 2025年5月31日 · 0 Comment

我正在进行一项自然语言处理任务，分析文档并将其分类到六…

IT技术

Keras深度自编码器结构中的NoneTypeError / 形状错误

xiaolong · 2025年5月31日 · 0 Comment

我遇到了让我的神经网络进行训练的问题。我定义的神经网络…

IT技术

使用Keras自编码器模型检测文本中的异常

xiaolong · 2025年5月31日 · 0 Comment

我正在尝试创建一个能够在文本序列中发现异常的自编码器:…

IT技术

如何训练标签为[5,30]形状的模型？

xiaolong · 2025年5月31日 · 0 Comment

如何训练一个数据集，其中每个标签的形状为[5,30]？…

IT技术

如何使用BERT和Elmo嵌入与sklearn

xiaolong · 2025年5月31日 · 0 Comment

我创建了一个使用sklearn的Tf-Idf的文本分类…

IT技术

如何处理重复的文本数据但具有不同的标签或类别？

xiaolong · 2025年5月31日 · 0 Comment

已关闭。此问题不符合 Stack Overflow …