Java/Python中的自动文本反馈分析

我需要开发一个基于自动学习的文本反馈分析系统,用于一系…

使用随机森林分类器时出现TypeError:稀疏矩阵长度不明确;应使用getnnz()或shape[0]?

我在学习scikit learn中的随机森林,并希望用…

为什么scikit learn中的TfidfVectorizer的token_pattern参数不起作用?

我有以下文本: data = [‘Hi, this i…

在自然语言处理中查找文本中的标记概率

我在opennlp的文档页面上发现了这个类Tokeni…

Java Apache OpenNLP工具包中的内置Porter词干提取器 [duplicate]

这个问题已有答案: 是否有Porter2词干提取器的J…

如何在Java文本中查找命名实体

以下是使用OpenNLP在Java中识别命名实体的代码…

Regex / “token_pattern” for scikit-learn text Vectorizer

我在使用sklearn进行自然语言处理的向量化,使用的…

如何在没有目标标签的情况下对文本进行分类?

我想知道是否有办法使用Python和Sklearn机器…

word2vec中的负采样概念是什么?

已关闭。 此问题与编程或软件开发无关。目前不接受回答。…

Mallet中csvIterator的参数是什么意思?

我在使用Mallet的主题建模示例代码,虽然运行正常,…

使用scikit-learn和自己的语料库理解accuracy_score?

假设我已经使用scikit-learn的SVC进行了一…

计算二阶点对互信息中的beta时出现错误

我按照这个规则操作,但我的结果与论文中的结果不符! 当…

如何使用scikit-learn对列表中的列表进行向量化?

我想使用scikit-learn对包含列表的列表进行向…

理解scikit CountVectorizer中的min_df和max_df

我有五个文本文件输入到CountVectorizer中…

标记文本分类问题,预测错误?

我在尝试使用scikit-learn提供的不同分类器和…

如何使用scikit-learn对标记的二元组进行向量化?

我在自学如何使用scikit-learn,并决定开始第…

在scikit-learn中,文本分类时如何标准化文本数据的排列方式?

我有一个监督文本分类的NLP任务。我对语料库进行了词性…

传递术语-文档矩阵到Gensim LDA模型

我的术语-文档矩阵是以numpy矩阵格式存储的,并且我…

在scipy中稀疏矩阵的含义是什么?

我有一个自然语言处理任务,并且我在使用scikit-l…

使用Python进行主题建模的LDA

我是Python的新手,正在尝试使用LDA包(http…

使用Python中的Gensim进行主题建模

我有两个类别的词袋列表。假设类别A中有n个项目,类别B…

使用Scikit Learn进行单字分析

我正在尝试使用Sci Kit Learn对单字进行一些…

最快的计数向量化实现

我正在寻找一种比scikit-learn的CountV…

为什么分类器在从测试文件中预测时会出现额外的标签?

在之前的一篇帖子中,我询问了关于文本分类的内容,我希望…

提取句子含义

有没有什么Java库可以帮助提取句子或段落的内容?我需…