为什么”machine_learning”词形还原既是”machine_learning”又是”machine_learne”?

我在多个文本上运行LDA。当我生成一些关于生成的主题的…

FastText类使用了未定义的对象

我在阅读一篇文章时遇到了FastText类,这篇文章是…

从头实现TF-IDF向量化器

我在尝试用Python从头开始实现一个tf-idf向量…

使用整个语料库训练W2V模型是否合适?

我有一组自由文本的医学叙述语料库,打算用于分类任务,目…

添加词汇并使用在更大语料库上构建的另一个模型改进词嵌入

我是NLP新手,目前正在构建一个特定领域的NLP系统。…

如何将包含标注句子的文本输入到神经网络中?

我在深度学习方面还是新手。我正在尝试为文本提取标题。 …

检测文本中的问题

我有一个项目,需要分析一段文本,以提取信息,判断发布该…

使用监督学习算法计算句子极性有哪些方法?

我想像VADER或TextBlob那样计算句子的极性,…

如何从Fastai学习器语言模型中获取句子嵌入

我已经使用Fastai成功地对语言模型进行了微调。我希…

在数据框中获取拼写错误单词的字典

我正在处理情感分析问题。尝试使用autocorrect…

自定义Spacy NER模型整体F分数与单个实体F分数之间存在较大差异

我正在使用Spacy训练一个自定义的NER模型,训练数…

使用Keras实现两个不同输入样本大小的多任务学习

我正在使用Keras的API中的共享层部分的代码实现多…

使用gensim的fasttext包训练词嵌入后,如何嵌入新的句子?

在阅读了gensim的文档教程后,我不明白从已训练的模…

如何使用gensim的fasttext包装器训练词嵌入表示?

我想用fasttext训练我自己的词嵌入。然而,按照教…

我们可以找到通过命名实体识别标记的实体周围的句子吗?

我们已经准备好了一个能够识别自定义命名实体的模型。问题…

如何让spaCy不生成-PRON-词形?

我在使用spaCy来对大量推文进行词形还原。然而,当我…

从头开始用Python实现Bleu评分

在观看了Andrew Ng关于Bleu评分的视频后,我…

如何解决sklearn在处理大数据时出现的内存错误?

我有一个庞大的数据集要处理,数据集几乎包含120万行,…

这是什么样的NLP?

我知道NLP分类是将整个文本分类为(健康、体育、社会、…

使用LSTM生成助记符 | 如何确保我的模型使用损失函数生成有意义的句子?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

如何查看每个词的tf-idf得分

我试图了解文档中每个词的tf-idf得分。然而,它只返…

如何修复 ‘ValueError: Found input variables with inconsistent numbers of samples: [32979, 21602]’?

我在制作一个用于情感分析的逻辑回归模型时遇到了这个问题…

Twitter情绪分析字符串

我编写了一个程序,该程序可以处理包含推文及其标签(0表…

使用Spark Dataframe删除相同词语的逆序重复项

我已经成功使用Spark Dataframe的方法dr…

如何在Python中从文本文件中提取不同格式的特征?

我有几份公司发票的文本文件,这些文件中包含不同种类的日…