在Python中使用sklearn时,fit、transform和fit_transform有什么区别?

from sklearn.preprocessing …

重塑pandas.DataFrame以便在GridSearch中使用

我在尝试在GridSearch中使用Pipeline时…

Scikit-Learn: 如何使用矩阵X的变换来变换目标变量Y

我正在处理一个回归问题,我的特征在矩阵X中,目标值在Y…

预测不同类型的数据集而不是所需的数据集

我有训练和测试数据集。我想对我的测试数据集进行预测并将…

NotFittedError: TfidfVectorizer – 词汇表未被拟合

我正在尝试使用scikit-learn/pandas构…

在特征选择中,我应该分别对训练集和测试集使用SelectKBest吗?

我的问题是,我应该先对整个数据集进行selectkbe…

如何在Spark集群中分配任务?

我有一个由数据集和多个机器学习算法(使用scikit-…

预定义权重的随机梯度下降分类器

我得到了一组测试数据,这些数据由三个人判定为真或假。我…

如何在scikit-learn中对多级别的分类变量进行编码?

大家好。我有一个大型数据集(6万个样本,50个特征)。…

为什么BernoulliNB分类器对所有数据集返回相同的值?

我尝试使用BernoulliNB来预测鸢尾花数据集。但…

Keras – 如何使用KerasRegressor进行预测?

我对机器学习是新手,正在尝试使用Keras来执行回归任…

sklearn: 获取点到最近聚类的距离

我正在使用像DBSCAN这样的聚类算法。 它返回了一个…

如何使用校准图和概率分布来改进分类模型?

我一直在研究一个分类问题。使用不同的分类器(见下图),…

使用pyFM处理Frappe数据集

我尝试在Frappe (http://baltruna…

我正在尝试在scikit-learn中使用自定义的RBF核实现SVM,但出现了错误,该怎么办?

在TensorFlow上使用MNIST数据集进行预测的困境

我目前是TensorFlow的新手,我已经用MNIST…

特征顺序对sklearn中的决策树算法有影响吗?

我阅读了一些资料: sklearn中的决策树文档 Qu…

Sklearn LabelEncoder在排序时抛出TypeError

我正在使用Kaggle的泰坦尼克号数据集学习机器学习。…

如何调整Sklearn的随机森林?max_depth与min_samples_leaf

max_depth VS min_samples_le…

sklearn Random Forest训练和测试数据的准确率相同

我正在尝试为电动车充电事件数据构建一个分类模型。我想预…

从 sklearn Pipeline 对象中返回系数

我已经使用 RandomizedSearchCV 拟合…

机器学习,将训练模型应用于测试

作为政治学研究生的我,实在是高估了自己的能力(所谓雄心…

使用sklearn距离算法的困惑

当我想在KNeighborsClassifier中使用…

使用SciKit对句子进行分类

我有两个包含大量句子的文件。一个文件中的句子含有正面词…

Python, 机器学习 – 在自定义验证集上执行网格搜索

我正在处理一个不平衡的分类问题,其中负类样本的数量是正…