在简单线性回归中使用cross_val_score时出现FitFailedWarning

我使用了一个从互联网上下载的非常简单的CSV文件,文件…

在 scikit-learn 中创建自定义变换器以添加聚类标签

我正在 scikit-learn 中编写一个自定义变换…

如何在GridSearchCV的管道中使用TransformedTargetRegressor的转换器参数设置为PowerTransformer()的逆变换

我使用以下GridSearchCV训练了一组线性回归模…

我的分类器在所有测试数据集上(除了错误的照片)都给出了1.0的准确率

现有情况: 数据集:115张彩色图像,尺寸为256&#…

使用交叉验证训练8个不同的分类器,结果在相同文件上得到相同的准确率?

我有一个脚本,它应该使用交叉验证来训练不同的模型,然后…

### 朴素高斯预测概率仅返回0或1

我训练了scikit-learn中的GaussianN…

获取转换后用于分类的最重要特征名称

我在Python中有一个分类问题。我想找出哪些是分类中…

HDBSCAN参数之间的差异

我对HDBSCAN中以下参数的差异感到困惑 min_c…

如何使用Sk-learn的OneHotEncoder对数据框中的两个或多个列进行编码?

这是我的数据框 我想使用sklearn的OneHotE…

自定义Sklearn核函数的决策函数结果错误

我成功实现了自己的自定义线性核函数,使用clf.pre…

如何在Python中使用训练好的模型测试新句子 (sklearn)

我有用于多类文本分类的训练模型代码,并且它运行正常,但…

使用`GridSearchCV`测试完全删除管道中一个步骤的效果?[重复]

这个问题已经有答案了: 是否可以切换scikit-le…

为什么我的所有分类准确率得分都相同?

已关闭。 此问题需要调试细节。目前不接受回答。 编辑问…

使用 `TfidfVectorizer`、`CountVectorizer` 等时,是否需要对标签进行编码?

在处理文本数据时,我理解需要将文本标签编码成某种数值表…

如何利用OneHotEncoder的数组输出

我是Python初学者… 我正在尝试理解如…

随机森林分类器如何进行分类?

我了解到Sklearn将多类分类问题视为一系列二元问题…

线性回归系数

我目前正在使用statsmodels(虽然我也很乐意使…

ValueError: 发现输入变量的样本数不一致:[6, 80]

我在处理下面的代码时遇到了问题(这是imblearn管…

奇怪的聚类输出(scikitlean kmeans)

我有一个总共有四个标签的不平衡数据集,其中两个标签的出…

使用随机森林分类器进行多类分类时出现未知标签类型:’continuous’

我的代码: rf_classifier = Rando…

为什么在交叉验证时有负均绝对误差(neg_mean_absolute_error),却没有均绝对误差(mean_absolute_error)?

为什么使用负均绝对误差而不是直接使用均绝对误差?负均绝…

如何使用FeatureUnion构建参数网格?

我正在尝试运行一个结合了文本和数值特征的模型,但遇到了…

如何使用FeatureUnion和Pipeline正确构建包含文本和数值数据的SGDClassifier?

我有一个特征数据框(DF),看起来像这样: 文本 数字…

如何在拟合Sklearn估计器和变换器之前手动指定正类

我正在尝试使用UCI ML Repo中的相关数据集预测…

在使用train_test_split之前和之后应用SMOTETomek时的不同得分

我正在尝试将文本分类到6个不同的类别。由于我的数据集不…