在推文中检测危险

已关闭。 此问题正在寻求关于软件库、教程、工具、书籍或…

stanford NER分类增加额外类别

目前的stanford NER主要提供6个类别LOCA…

如何在scikit-learn中使用哈希技巧对二元组进行向量化?

我有一些二元组,比如说:[(‘word’,’word’…

如何使用Pattern对西班牙语单词进行词形还原?

我想对一组评论进行词形还原。据我所知,nltk无法对英…

如何使用nltk对西班牙语单词列表进行词干提取?

如何使用nltk的SnowballStemmer对以下…

为什么自然语言处理和机器学习社区对深度学习感兴趣?

为什么自然语言处理和机器学习社区对深度学习表现出浓厚的…

NLP项目:社交媒体评论摘要

我计划在最后一年做一个关于自然语言处理(使用NLTK)…

在CRF模型中可以使用数值特征吗

在CRF模型中添加数值特征是否可行或有益?例如,序列中…

训练两个特征而不是一个

我有这段代码。我有两个特征。我如何将这两个特征一起训练…

scikit-learn TfidfVectorizer 的含义?

我在阅读关于scikit-learn的TfidfVec…

### scikit-learn 能处理多少文本数据?

我有一个情感分析任务,需要明确 scikit-lear…

用于自然语言处理语料库的人工标注工具

已关闭。 此问题正在寻求关于软件库、教程、工具、书籍或…

基于文档重要性的句子排名算法

对于任意文档,如何根据句子对文档的重要性对其进行排名?…

使用SentiWordNet和Apache OpenNLP的情感分析工具

我正在使用SentiWordNet和Apache NL…

词性标注器的训练数据从哪里获取?

我想实现一个词性标注器,但不知道从哪里可以获取大量的训…

将scikit-learn的TFIdfVectorizer中的特征名称更新

我在尝试以下代码 from sklearn.featu…

在词性标注的背景下,k折验证是什么意思?

我知道对于k折交叉验证,我应该将语料库分成k个相等的部…

统计机器翻译的短语提取算法

我已经编写了以下用于统计机器翻译的短语提取算法的代码。…

错误分类到多个类别中不同比例的类别

我遇到了以下问题:我试图对大量文本文档进行分类。 共有…

机器理解自然语言 – nlp

已关闭。 此问题不符合 Stack Overflow …

在不同主题数量下LDA结果的相似性?

如果我们在LDA中选择20个主题,然后再选择30个主题…

在线版本的scikit-learn的TfidfVectorizer

我想使用scikit-learn的HashingVec…

使用同义词的文档相似性

我有一堆文档,其中一些文档是其他文档的副本,文本被打乱…

UIMA中的名称实体关系

我是UIMA的新手,目前我遇到了下面的情况。 如何对U…

使用Stanford Parser解析杂乱文本

我正在使用Stanford Parser处理一大块文本…