使用nltk对文本文档进行分类

我目前正在进行一个项目,我从电子邮件中提取邮件正文,使…

NLTK: 语料库级别BLEU分数与句子级别BLEU分数

我在Ubuntu上使用Python导入了nltk来计算…

如何在训练结束后让nltk的NaiveBayes分类器学习更多特征集?

我现在正在使用nltk_classifier对句子的类…

如何检查一个句子是否通顺可读?

我的目标是能够检测出由计算机生成的旋转内容。以下是一些…

修改tf-idf向量化器以加强某些关键词的权重

我在创建tf-idf矩阵以计算余弦相似度。但我想让某个…

Python中数据pickle的错误 [duplicate]

这个问题已经有了答案: 在NLTK中保存朴素贝叶斯训练…

使用nltk计算两个句子/字符串/文本之间的句法相似度/距离 [duplicate]

这个问题已有答案: 如何计算两个文本文档之间的相似度?…

MongoDB + K均值聚类

我使用MongoDB作为我的数据存储,并希望在单独的一…

如何使用序列标记处理不同上下文的查询?

我正在使用pycrfsuite(BIO标记)和nltk…

使用NLTK、scikit-learn和OneVsRestClassifier开启多标签分类

免责声明:我对AI、Python、NLTK和sciki…

Q: 机器学习模型能解决基于规则的问题吗?

机器学习能否用于验证文本文档中的陈述或捕捉错误? 例如…

如何将函数(BigramCollocationFinder)应用到Pandas DataFrame

我不太习惯编程,需要一些帮助来解决一个问题。我有一个包…

NLTK: conllstr2tree 在 Python3 中无法正常工作

说明我尝试做的事情的例子可以在 http://www….

使用Python进行多种特征类型的机器学习

我能够使用Python中的scikit-learn和N…

使用Python Pandas训练朴素贝叶斯分类器的不同特征类型

我想使用多个特征来训练朴素贝叶斯分类器,以分类&#82…

NLTK 基于距离度量的一致性协议

我有一个任务,需要计算标注者间一致性,这是在多标签分类…

标准化餐厅菜品列表

我有一大组餐厅菜品数据(例如,“拉猪肉”,“牛腩”&#…

在NLTK(Python)中,语料库和词汇表有什么区别

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在NLTK中显示标签的概率/置信度

我正在使用Python NLTK库中的MaxEnt分类…

为Python机器学习(朴素贝叶斯)算法创建特征字典

我想通过姓氏预测,例如区分中国人和非中国人。我特别想从…

如何使用词性标记序列作为特征训练朴素贝叶斯分类器?

我有两类句子,每类都有相当独特的词性标记序列。我如何使…

TypeError: ‘WordListCorpusReader’ 对象没有属性 ‘__getitem__’,在使用 nltk.classify.apply_features 时出现

我正在按照这个网站上的教程学习 NaiveBayes。…

导入自己的数据进行文档分类

我有多个文件夹,每个文件夹中包含多个文本文件。这些文件…

Python NLTK 朴素贝叶斯分类器:该分类器用于分类输入的底层计算是什么?

我使用Python NLTK中的朴素贝叶斯分类器来计算…

如何使用scikit-learn加载和处理.txt文件?

假设我在桌面上有一个文件夹,里面有不同的.txt文件。…