如何使用scikit-learn可视化两个类别的边界/决策函数

我在机器学习领域还是新手,所以还不明白如何在词袋模型的…

随机森林分类器的predict_proba()结果与predict()不匹配?

from sklearn.model_selectio…

python sklearn pipiline fit: “AttributeError: lower not found”

我正在尝试使用sklearn将几组文本数据分类为3个类…

如何将另一个文本特征添加到当前的词袋分类中?在Scikit-learn中

这是我的输入矩阵 输入图像描述 我的示例代码: fro…

查找最相关的三个类别及其相应的概率

从下面的脚本中,我找到了多类文本分类问题中最高的概率及…

keras神经网络输出浮点数但我需要布尔输出

这是我的代码,已加载预训练的权重和嵌入矩阵 from …

NLTK分类器如何处理整数特征?

我的特征向量中包含整数类型的特征,但NLTK的Naiv…

sklearn模型数据转换错误:CountVectorizer – 词汇表未拟合

我已经训练了一个用于主题分类的模型。然后当我准备将新数…

通过使用分类器对实例的置信水平来提高预测得分

我使用了三个分类器(RandomForestClass…

随机森林文本分类在预测时产生额外行

我使用随机森林进行文本分类。我的输入数据有17197行…

WEKA中的神经网络

我有一个已经分类好的文本数据集,共有7个可用类别。 我…

fastText官方Python绑定中有.predict方法吗?

我知道有一些非官方的Python绑定(如fasttex…

检查字符串是否构成一个单词

已关闭。此问题需要详细信息或澄清。目前不接受回答。 想…

使用机器学习对大型文本进行分类

我有一个大型的xls文档,每行包含一个问题ID、其描述…

使用不同类型列作为训练数据集

之前我仅使用一列(字符串类型数据)作为训练集,现在我想…

文本数据类别分类

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

查找正确和错误分类的数据

我想找到在应用多项式朴素贝叶斯分类算法后成功分类和未被…

使用Sci-kit learn/python对自然文本进行有效分类

我想让我的分类算法根据一组类别对我的自然语言原始数据进…

如何构建一个用于词语的文本分类器?

已关闭。这个问题需要更加聚焦。目前不接受回答。 想要改…

使用scikit-learn进行文本分类时,我必须同时使用CountVectorizer和TFIDF吗?

已关闭。此问题需要更多细节或更清晰。目前不接受回答。 …

将句子分类到多个类别中

我是NLTK和Scikit-learn的新手。我希望能…

为训练准备数据

我正在尝试通过创建字符文本的一热编码来准备数据文件,以…

使用Scikit-learn计算信息增益

我在使用Scikit-learn进行文本分类。我想计算…

使用SGDClassifier的partial_fit方法进行增量/在线学习

我已经构建了一个增量学习模型,但不确定它是否正确。我有…

scikit-learn中的CountVectorizer和CharNGramAnalyzer有什么区别?

我对CountVectorizer和CharNGram…