对于给定文档,寻找最合适的标签是否有数据挖掘/文本挖掘/机器学习技术?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

机器学习与编程语言领域的交叉

虽然我的研究领域是机器学习(ML),但我需要在编程语言…

二元分类中评估指标与特征有何区别?

我很难在脑海中区分这两个概念。 我知道像BLEU这样的…

能否在朴素贝叶斯文本分类算法中加入作者信息?

我正在进行一个文本分类项目,试图为国会记录中的演讲分配…

Java算法从字符串中提取信息

我正在尝试在我的应用程序中实现一个智能搜索功能。用例:…

如何计算字符串的每字符比特数?(bpc)

我在阅读的一篇论文,http://www.cs.tor…

NLP: 计算文档属于某个主题的概率(使用词袋模型)?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

Labelled LDA 使用

我正在进行一个项目,需要应用主题模型LDA。由于我的文…

使用命名实体数据集

我正在进行一个分类任务,我们正在构建模型来检测文本片段…

### 朴素贝叶斯文本分类在某一类别上失败的原因是什么?

已关闭。 此问题是非主题相关的。目前不接受回答。 想要…

如何在新(测试)数据上重新创建相同的文档术语矩阵

假设我有基于文本的训练数据和测试数据。更具体地说,我有…

仅为一个标签训练nltk分类器

我刚开始学习nltk,并且在按照书本学习。第六章是关于…

期望最大化算法 – 抛硬币示例中的观测次数

我看到了许多与期望最大化算法相关的示例。 以下是一些链…

学习从一组向量中提取表示

我目前正在处理以下问题:我有一组特征向量(实值),这些…

为什么向量归一化可以提高聚类和分类的准确性?

《Mahout in Action》一书中提到,归一化…

scikit-learn, 向文档向量化集合添加特征

我刚开始使用scikit-learn,正在尝试将一组文…

无监督自动标记算法?

我想构建一个网络应用程序,允许用户上传文档、视频、图片…

为词性标注创建特征函数

我正在尝试使用感知器进行监督分类,从而对句子进行词性标…

api showing context of words in sentences

你好,我对用于确定句子中词语上下文的API很感兴趣 自…

从单个词中提取特征

通常,人们希望通过词袋模型从文本中提取特征,统计词频并…

在Android中读取词性标注模型

我之前在一个普通的Java应用程序中使用openNLP…

文本的逐点互信息

我想知道如何计算用于文本分类的逐点互信息。更具体地说,…

监督潜在 Dirichlet 分配用于文档分类?

我有一组已经由人工分类的文档,分属于不同的组别。 有没…

使用监督术语加权方法与KNN算法

是否可以将监督术语加权模型与KNN分类器一起使用?我想…

产品分类?

有几个关于汽车制造商和型号的数据集。每个数据集包含数百…