标记文本分类问题,预测错误?

我在尝试使用scikit-learn提供的不同分类器和…

如何使用scikit-learn对标记的二元组进行向量化?

我在自学如何使用scikit-learn,并决定开始第…

为什么分类器在从测试文件中预测时会出现额外的标签?

在之前的一篇帖子中,我询问了关于文本分类的内容,我希望…

如何为scikit-learn分类器获取不同类别的最具信息量的特征?

NLTK包提供了一个方法show_most_infor…

如何使用Pattern对西班牙语单词进行词形还原?

我想对一组评论进行词形还原。据我所知,nltk无法对英…

如何使用nltk对西班牙语单词列表进行词干提取?

如何使用nltk的SnowballStemmer对以下…

NLP项目:社交媒体评论摘要

我计划在最后一年做一个关于自然语言处理(使用NLTK)…

训练两个特征而不是一个

我有这段代码。我有两个特征。我如何将这两个特征一起训练…

python: 如何在scikit-learn分类器(如SVM)中使用词性(POS)特征

我想使用nltk.pos_tag返回的词性(POS)来…

自动纠正文档语料库

我有一个大约6GB大小的文档语料库,主要是移动平台上的…

使用TextBlob进行朴素贝叶斯文本分类:增加样本量后所有实例都被预测为负面

我正在使用朴素贝叶斯模型将文档分类为正面和负面标签。对…

识别Python中的动词时态

如何使用Python + NLTK来识别一个句子是指过…

使用scikit learn计算文本相似性时出现错误

我是向量空间模型(VSM)的初学者。我尝试了这个网站上…

使用Python和NLTK获取大量名词(或形容词)列表;或Python疯狂填词游戏

就像这个问题一样,我对按词性获取大量单词列表(长名词列…

如何将概率转换为分数?

我现在正在开发一个文档推荐程序,目前有点卡住了。对于每…

Python NTL – 识别文本兴趣/主题

我正在尝试构建一个模型,用于识别提供的文本的兴趣类别/…

如何更改NLTK中朴素贝叶斯分类器的平滑方法?

我使用NLTK的朴素贝叶斯方法训练了一个垃圾邮件分类器…

使用Python进行机器学习 – 获取标签的最佳特征组合

我的问题如下: 我对Python中的机器学习(使用NL…

NLTK Naive Bayes分类器的奇怪结果

我正在尝试使用NLTK的朴素贝叶斯分类器来对电影类型进…

仅为一个标签训练nltk分类器

我刚开始学习nltk,并且在按照书本学习。第六章是关于…

MAXent分类器NLTK输出理解

我正在尝试理解MAXent分类器的classifier…

如何将nltk中的特征写入txt文件?

我使用nltk训练了一个朴素贝叶斯分类器。函数show…

Scikits NB与NLTK NB的性能比较

我通过绘制它们在我的三类问题上的学习曲线,比较了NLT…

选择特征以识别Twitter问题是否“有用”

我通过使用正则表达式从Twitter的流中收集了一批问…

如何正确使用NLTK进行多类分类?

所以,我正在尝试进行文本多类分类。我阅读了很多旧的问题…