无监督字符串聚类

我有一份包含1000多个关键词的列表,希望根据相似性将…

什么是这种NLP符号的含义?

我正在学习NLP,试图在一个语料库上进行关系提取。我找…

在二元分类中,为什么我们只从输入映射到特征空间?

我正在学习这些关于自然语言处理和机器学习的幻灯片。在第…

使用RBF核SVM时,c或gamma的高值是否会引起问题?

我在使用WEKA/LibSVM训练一个术语提取系统的分…

简单统计是/否分类器在WEKA中

为了比较我在标记文本分类研究中的结果,我需要一个基准进…

在NLP/概率/机器学习符号中:字母上方的波浪线表示什么?

我正在阅读这篇论文。在第1.1节中,作者提到: 字母上…

为什么我们可以用熵来衡量语言模型的质量?

已关闭。此问题属于基于意见的。目前不接受回答。 想要改…

扩大带有类别的文本语料库

我有一个包含许多句子的文本语料库,其中一些命名实体已被…

合并机器学习中的两个模型

我目前正在使用斯坦福NER训练一个命名实体识别模型。是…

寻找产品评论数据集

已关闭。 此问题不符合 Stack Overflow …

自动纠正文档语料库

我有一个大约6GB大小的文档语料库,主要是移动平台上的…

如何从文本中提取时间和日期

我在查看邮件时,发现Gmail自动建议我将coming…

在大型arff数据集文件上运行Weka

我有一个arff文件,包含700个条目,每个条目有42…

使用哪个斯坦福NLP包来进行内容分类?

已关闭。 此问题正在寻求关于软件库、教程、工具、书籍或…

奇异值分解(SVD)在潜在语义分析(LSA)中生成的矩阵的含义/暗示

SVD在LSA中被用来获取潜在的语义信息。我对SVD矩…

布朗聚类算法的输出结果是什么意思?

我运行了来自 https://github.com/p…

如何为sklearn下载数据集? – python

在NLTK中,有一个nltk.download()函数…

文本分类 – 如何找出最影响决策的特征

在使用SVMlight或LIBSVM进行情感分析,将短…

Solr/Carrot2 集成

Solr/Carrot2 集成 我为每个文本文件创建了…

最大熵分类中的“共识”

假设我们有三个类别:A、B和C,我们使用标准的最大熵分…

如何使用NLP库从报纸文章中提取信息?

我在进行大学的毕业设计项目,我的任务是从包含犯罪的新闻…

用于分类名词短语的模型?

我需要一个模型来完成以下任务: 一组单词及其词性标签。…

进行分类时计算置信度

我使用朴素贝叶斯算法来预测电影评分为正面或负面。我已经…

将分类器导出到人类可读文件

我在自然语言处理中有这样一个任务:训练一个分类器并将其…

识别Python中的动词时态

如何使用Python + NLTK来识别一个句子是指过…