使用scikit-learn进行文本分类:如何从pickle模型中获取新文档的表示

我有一个使用文档训练集的tf-idf表示并对其应用逻辑…

使用nltk对文本文档进行分类

我目前正在进行一个项目,我从电子邮件中提取邮件正文,使…

如何识别电影或传记等文档类别

我目前正在进行一项任务,将一些文档分类到一些预定义的类…

使用机器学习进行作者归属分析

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

scikit-learn – 使用svm.svc分类器进行多标签分类,是否可以在不设置probability=True的情况下实现?

我尝试使用scikit-learn中的Pipeline…

scikit-learn TfidfVectorizer 的含义?

我在阅读关于scikit-learn的TfidfVec…

使用R进行层次预测

已关闭。 此问题不符合 Stack Overflow …

新闻文章多类别分类算法

我想将新闻文章分类到它所属的类别中。我有四类新闻,例如…

如何计算单个新文档的TF*IDF以进行分类?

我使用文档-词向量来表示一组文档。我使用TF*IDF来…

基于研究论文标题的研究论文分类

大家好,我正在进行一个项目,需要根据论文的标题将研究论…

Scikit-learn 多类别朴素贝叶斯分类器的概率输出 y

我正在进行推文分类,每条推文可以属于几个类别中的一个。…

可扩展或在线离核多标签分类器

在过去的2-3周里,我一直在为这个问题绞尽脑汁。我有一…

Libsvm: SVM归一化从0还是0.001开始

我在文档分类中使用libsvm。 我的项目中仅使用了s…

Libsvm模型文件格式 无模型编号

我在使用libsvm进行文档分类。我在项目中使用了sv…

如何对SVM的tf-idf向量进行归一化?

我在使用支持向量机进行文档分类。每个文档的特征集是一个…

使用朴素贝叶斯分类器进行文档分类

我正在使用Mahout中的简单朴素贝叶斯算法制作一个文…

查找文本的相关性,基于词汇/短语的白名单和黑名单

这是我想在网上搜索某些内容但不知道其名称的情况。 我有…

### 朴素贝叶斯文本分类在某一类别上失败的原因是什么?

已关闭。 此问题是非主题相关的。目前不接受回答。 想要…

Scikit-learn: BernoulliNB, v0.10与v0.13:结果差异很大

这是对这个讨论的进一步探讨,在我使用GaussianN…

根据内容相似性在网格中排列文档

如何将文档排列在一个空间中(例如多个网格),使得它们的…

KNN分类器的情感分析与类别分析精度比较

我在Java中实现了KNN分类器,并得到了一个奇怪的结…

text categorization classifiers

有人知道好的开源文本分类模型吗?我知道斯坦福分类器、W…

sklearn.feature_selection中除Chi-2之外的特征选择度量

我在进行一些文本分类任务时尝试使用sklearn.sv…

如何使用Mallet命令行提示符报告精确度和召回率?

我在使用Mallet的MaxEnt分类器进行文本分类。…

SKLearn 交叉验证:

我在进行文本分类,可能会遇到训练数据中未包含的词汇,这…