如何使用fuzzywuzzy从列表中提取完整文本?

以下是我的代码: from fuzzywuzzy im…

使用句子变换器/ Pytorch 正确编码大量文档的方法是什么?

我在使用sentence_transformers库编…

如何合并两个CountVectorizer以处理重复项?

考虑这个简单的例子 data = pd.DataFra…

XGBClassifier ValueError: 操作数无法一起广播,形状为(2557,) (8,) (2557,)

我正在进行一个文本分类项目。 在探索不同的分类器时,我…

如何使用spacy train向现有自定义NER模型添加实体?(Spacy v3.0)

我目前正在实现一个自定义NER模型接口,用户可以通过前…

### 朴素高斯预测概率仅返回0或1

我训练了scikit-learn中的GaussianN…

在Python中使用AllenNLP进行共指消解的代码是否存在?

在Python中使用AllenNLP进行共指消解的代码…

使用带有实体标尺和命名实体识别管道的预训练自定义模型时出现Spacy错误

我使用了一个带有Gensim自定义词向量的spacy空…

如何访问FastText分类器管道?

众所周知,Facebook的FastText是一个出色…

如何在Python中使用训练好的模型测试新句子 (sklearn)

我有用于多类文本分类的训练模型代码,并且它运行正常,但…

ValueError: 发现输入变量的样本数不一致:[6, 80]

我在处理下面的代码时遇到了问题(这是imblearn管…

如何使用FeatureUnion构建参数网格?

我正在尝试运行一个结合了文本和数值特征的模型,但遇到了…

如何使用FeatureUnion和Pipeline正确构建包含文本和数值数据的SGDClassifier?

我有一个特征数据框(DF),看起来像这样: 文本 数字…

将word2vec模型应用于具有数据框结构的训练集

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

理解pytrec_eval中nDCG格式的问题?

我正在使用pytrec_eval来计算nDCG分数。例…

IndexError: 列表索引超出范围, NLP BERT Tensorflow

我使用了Bert模型进行了训练并保存为hdf5文件,但…

如何加快Fasttext的get_nearest_neighbors()函数运行速度?

我在尝试使用Fasttext提取僧伽罗语中的形态/相似…

文本(余弦)相似度

我按照Fred Foo在Stack Overflow上…

如何处理词袋模型中的词汇表外单词

我在处理基于文本的数据集时尝试使用词袋模型(BoW)进…

用于比较两个向量进行分类的损失函数

我正在进行一项自然语言处理任务,分析文档并将其分类到六…

Keras深度自编码器结构中的NoneTypeError / 形状错误

我遇到了让我的神经网络进行训练的问题。我定义的神经网络…

使用Keras自编码器模型检测文本中的异常

我正在尝试创建一个能够在文本序列中发现异常的自编码器:…

如何训练标签为[5,30]形状的模型?

如何训练一个数据集,其中每个标签的形状为[5,30]?…

如何使用BERT和Elmo嵌入与sklearn

我创建了一个使用sklearn的Tf-Idf的文本分类…

如何处理重复的文本数据但具有不同的标签或类别?

已关闭。 此问题不符合 Stack Overflow …