序列化模型和向量化器

我在序列化一个模型以便稍后使用。然后加载模型并在其上运…

在同一个模型上多次调用fit()会怎样?

当我实例化一个scikit模型(例如LinearReg…

Python: 快速对数组进行MinMax缩放

我使用以下方法将一个n维数组缩放到0和1之间: x_s…

DecisionTreeClassifier 如何查找下一个值

如何在从训练集构建决策树后查找下一个值?我需要知道在我…

如何对分词后的文档进行聚类

我有一组文档,我想了解它们与某一特定文档在相似性上的接…

k_mean.fit 返回 ValueError: setting an array element with a sequence

我试图通过kmeans聚类来处理图像特征表示,这些特征…

解释混淆矩阵

已关闭。这个问题需要更加聚焦。目前不接受回答。 想要改…

在XGBClassifier中设置booster

我阅读了文档,

sklearn TfidfVectorizer : 通过不移除其中的停用词生成自定义N-grams

以下是我的代码: sklearn_tfidf = Tf…

在自定义数据集上训练SVM分类器时出现错误 [duplicate]

这个问题已有答案: Python scikit-lea…

Numpy数组转换错误

我有一个包含字符串和浮点数据的数据集。NumPy试图将…

如何增加CountVectorizer中某个单词的权重

我有一个已经分词的文档,然后我拿另一个文档来比较它们,…

查找最相关的三个类别及其相应的概率

从下面的脚本中,我找到了多类文本分类问题中最高的概率及…

sklearn MultinomialNB 仅预测类先验

我目前正在尝试开发自己的朴素贝叶斯分类器,用于分类特征…

SKlearn 对 X 和 Y 的 reshape 警告

我刚开始学习机器学习,正在使用 Python(3.6)…

决策树分类器的精确召回曲线下面积为一个正方形

我正在使用scikit-learn中的Decision…

在随机森林分类器中遇到未拟合错误?

我有4个特征和一个目标变量。我使用RandomFore…

sklearn GridSearchCV 在评分函数中未使用 sample_weight

我有一组数据,每个样本都有不同的权重。在我的应用中,这…

逻辑回归对异常值敏感?在合成2D数据集上的应用

我目前正在使用sklearn的逻辑回归函数处理一个合成…

如何在Sklearn中保存PCA和T-SNE的学习权重/参数

我有两组数据,假设是A和B。我想对A应用PCA和T-S…

在Scikit Learn中对预测进行特征缩放

我一直在研究一个机器学习模型,目前使用的是带有Grid…

sklearn模型数据转换错误:CountVectorizer – 词汇表未拟合

我已经训练了一个用于主题分类的模型。然后当我准备将新数…

将数据集非随机地分割成训练集和测试集

我想将我的数据集分为两部分,75%用于训练,25%用于…

什么是sk-learn分类器的输入格式?

我刚开始使用scikit和numpy/pandas,但…

机器学习特征缩放

我有一个关于如何正确缩放我的数据集的问题。 我的数据集…