从文本内容中提取名词短语的最新技术是什么?

已关闭。 此问题不符合 Stack Overflow …

为什么这些词被认为是停用词?

我没有自然语言处理的正式背景,想请问NLP领域的专家能…

从句子中提取“有用”的信息?

我目前正在尝试理解这种形式的句子: 问题更多出在机顶盒…

在给定文本中发现“模板”?

如果我有大量的文本,并且试图发现其中最常出现的模板,我…

POS标记是确定性的吗?

我一直在试图理解为什么会发生这种情况,希望有人能对此提…

潜在 Dirichlet 分配与文档聚类的关系

我想澄清潜在 Dirichlet 分配(LDA)与文档…

将概念上相似的文档聚类在一起?

这更像是一个概念性的问题,而不是实际的实现,希望有人能…

k-fold交叉验证用于确定k-means中的k值?

在文档聚类过程中,作为数据预处理步骤,我首先应用奇异值…

大规模朴素贝叶斯分类器与top-k输出

我需要一个用于大规模朴素贝叶斯的库,能够处理数百万的训…

使用Java进行文本分类

我需要将一段文本或一个词归类到特定的类别中。例如,文本…

Mallet CRF SimpleTagger 性能调优

对于使用过Java库Mallet的SimpleTagg…

### 文档分析与标记

已关闭。 此问题不符合 Stack Overflow …

如何计算词性标注器的标签精确度和召回率?

我正在使用一些基于规则和统计的词性标注器来对一个包含大…

如何在不使用Google的情况下实现“大意是?”功能?

我知道这个问题有重复的提问: Google的“大意是?…

无监督情感分析

我读了很多文章,这些文章解释了在情感分析系统真正运作之…

使用Python进行医学信息提取

我是一名护士,懂得Python,但不是专家,只是用它来…

潜在语义分析的”预构建”矩阵

我想在开发一个小型应用时使用潜在语义分析,但我不希望自…

如何将词语作为分类中的数值特征

在任何机器学习算法中,使用词语本身作为特征的最佳方法是…

概率生成语义网络

我研究了一些简单的语义网络实现和解析自然语言的基本技术…

添加文档到已评分的TF-IDF集合?

我有一大批文档,它们的TF-IDF值已经计算完毕。我准…

从自然语言生成RDF

有没有可以从自然语言生成RDF的工具?SIMILE项目…

自动文本翻译

已关闭。 此问题正在寻求关于软件库、教程、工具、书籍或…

Java文本分类问题

已关闭。此问题是基于意见的。目前不接受回答。 想要改进…

将文档分类

我在Postgres数据库中存储了大约30万份文档,这…

从文本内容生成标签

我想知道是否存在一种算法或方法,可以通过一些权重计算、…