nlp – 第 9 页 – 学技术

IT技术

为什么”machine_learning”词形还原既是”machine_learning”又是”machine_learne”?

xiaolong · 2025年5月25日 · 0 Comment

我在多个文本上运行LDA。当我生成一些关于生成的主题的…

IT技术

FastText类使用了未定义的对象

xiaolong · 2025年5月25日 · 0 Comment

我在阅读一篇文章时遇到了FastText类，这篇文章是…

IT技术

从头实现TF-IDF向量化器

xiaolong · 2025年5月25日 · 0 Comment

我在尝试用Python从头开始实现一个tf-idf向量…

IT技术

使用整个语料库训练W2V模型是否合适？

xiaolong · 2025年5月25日 · 0 Comment

我有一组自由文本的医学叙述语料库，打算用于分类任务，目…

IT技术

添加词汇并使用在更大语料库上构建的另一个模型改进词嵌入

xiaolong · 2025年5月25日 · 0 Comment

我是NLP新手，目前正在构建一个特定领域的NLP系统。…

IT技术

如何将包含标注句子的文本输入到神经网络中？

xiaolong · 2025年5月25日 · 0 Comment

我在深度学习方面还是新手。我正在尝试为文本提取标题。 …

IT技术

检测文本中的问题

xiaolong · 2025年5月25日 · 0 Comment

我有一个项目，需要分析一段文本，以提取信息，判断发布该…

IT技术

使用监督学习算法计算句子极性有哪些方法？

xiaolong · 2025年5月25日 · 0 Comment

我想像VADER或TextBlob那样计算句子的极性，…

IT技术

如何从Fastai学习器语言模型中获取句子嵌入

xiaolong · 2025年5月25日 · 0 Comment

我已经使用Fastai成功地对语言模型进行了微调。我希…

IT技术

在数据框中获取拼写错误单词的字典

xiaolong · 2025年5月25日 · 0 Comment

我正在处理情感分析问题。尝试使用autocorrect…

IT技术

自定义Spacy NER模型整体F分数与单个实体F分数之间存在较大差异

xiaolong · 2025年5月25日 · 0 Comment

我正在使用Spacy训练一个自定义的NER模型，训练数…

IT技术

使用Keras实现两个不同输入样本大小的多任务学习

xiaolong · 2025年5月25日 · 0 Comment

我正在使用Keras的API中的共享层部分的代码实现多…

IT技术

使用gensim的fasttext包训练词嵌入后，如何嵌入新的句子？

xiaolong · 2025年5月25日 · 0 Comment

在阅读了gensim的文档教程后，我不明白从已训练的模…

IT技术

如何使用gensim的fasttext包装器训练词嵌入表示？

xiaolong · 2025年5月25日 · 0 Comment

我想用fasttext训练我自己的词嵌入。然而，按照教…

IT技术

我们可以找到通过命名实体识别标记的实体周围的句子吗？

xiaolong · 2025年5月25日 · 0 Comment

我们已经准备好了一个能够识别自定义命名实体的模型。问题…

IT技术

如何让spaCy不生成-PRON-词形？

xiaolong · 2025年5月25日 · 0 Comment

我在使用spaCy来对大量推文进行词形还原。然而，当我…

IT技术

从头开始用Python实现Bleu评分

xiaolong · 2025年5月25日 · 0 Comment

在观看了Andrew Ng关于Bleu评分的视频后，我…

IT技术

如何解决sklearn在处理大数据时出现的内存错误？

xiaolong · 2025年5月25日 · 0 Comment

我有一个庞大的数据集要处理，数据集几乎包含120万行，…

IT技术

这是什么样的NLP？

xiaolong · 2025年5月25日 · 0 Comment

我知道NLP分类是将整个文本分类为（健康、体育、社会、…

IT技术

使用LSTM生成助记符 | 如何确保我的模型使用损失函数生成有意义的句子？

xiaolong · 2025年5月25日 · 0 Comment

已关闭。此问题需要更加聚焦。目前不接受回答。想要改进…

IT技术

如何查看每个词的tf-idf得分

xiaolong · 2025年5月24日 · 0 Comment

我试图了解文档中每个词的tf-idf得分。然而，它只返…

IT技术

如何修复 ‘ValueError: Found input variables with inconsistent numbers of samples: [32979, 21602]’？

xiaolong · 2025年5月24日 · 0 Comment

我在制作一个用于情感分析的逻辑回归模型时遇到了这个问题…

IT技术

Twitter情绪分析字符串

xiaolong · 2025年5月24日 · 0 Comment

我编写了一个程序，该程序可以处理包含推文及其标签（0表…

IT技术

使用Spark Dataframe删除相同词语的逆序重复项

xiaolong · 2025年5月24日 · 0 Comment

我已经成功使用Spark Dataframe的方法dr…

IT技术

如何在Python中从文本文件中提取不同格式的特征？

xiaolong · 2025年5月24日 · 0 Comment

我有几份公司发票的文本文件，这些文件中包含不同种类的日…