如何在测试数据中选择与训练数据相同的特征?

我在参加Kaggle的房价竞赛。我有一个数据准备函数,…

Scikit-learn – 如何在CV对象中使用单一静态验证集? [重复]

此问题已有答案: 在使用sklearn进行网格搜索时使…

比较MinMaxScaled预测和目标与重新缩放的预测和目标时的相对误差差异

我正在运行一个深度学习模型,需要对数据集进行缩放。我使…

CountVectorizer fit_transform 错误:TypeError: expected string or bytes-like object

我正在尝试对从PDF文件通过OCR处理得到的多个.tx…

使用标准化器在SVM分类模型上的问题

我在使用支持向量机作为金融市场数据的分类器 我有一个包…

在使用sklearn计算NDCG时遇到错误

我试图计算二进制相关性的NDCG分数: from sk…

如何使用特定维度执行MultiLabelBinarizer?

我想知道是否有办法在sklearn中使用特定维度执行M…

是否可以同时使用train_test_split和KFold

我有一个简单的数据库。首先,我尝试使用 train_t…

如何将标签编码值与原始值一起使用

已关闭。此问题需要详细信息或澄清。目前不接受回答。 想…

AttributeError: ‘Pipeline’ 对象没有属性 ‘get_feature_names’

我构建了一个如下所示的 Pipeline: Pipel…

令人惊讶的测试/训练集大数组

我正在尝试使用包含157673条记录的数据集,通过线性…

如何使用留一法预测多列的Y值,使用SKlearn?

我有一个示例数据框,如下所示。Y列全部包含0,1的二元…

如何使用skLearn构建基准模型来预测具有多个值的Y

我有一个如下所示的样本数据框。我希望使用X=df.fi…

如何将主成分分析的结果映射回输入模型的实际特征?

当我运行下面的代码时,我看到了’pca.e…

学习曲线拟合

我在尝试为我的逻辑回归模型绘制学习曲线,但即使我调整了…

将分类特征转换为数值时出现”ValueError: A given column is not a column of the dataframe”错误

我正在使用来自Udemy课程的csv文件进行训练。为了…

“ValueError: 发现输入变量的样本数量不一致:[40, 10]” 数据分割问题

已关闭。 此问题无法重现或由拼写错误引起。目前不接受回…

如何构建一个用于布尔结果的机器学习模型?

我对Python和机器学习还比较新手。我正在尝试为以下…

GridSearchCV 在详细模式下不报告分数

我在 Python 3.8.5 和 scikit-le…

CV和测试折叠下的欠采样

我在构建处理不平衡数据(80:20)的机器学习分类器时…

使用StandardScaler和One-Hot-Encoding获取ColumnTransformer的特征名称

我正在使用一个简单的ColumnTransformer…

SGD分类器的精确度-召回率曲线

我正在处理一个二分类问题,并使用了一个如下所示的SGD…

sklearn中的SelectFromModel在随机森林和梯度提升分类器上选择的特征差异显著

正如标题中提到的,我使用sklearn中的Select…

### 在Python中使用sklearn进行多元线性回归时的错误

已关闭。 此问题需要调试细节。目前不接受回答。 编辑问…

使用train_test_split()返回的值列表作为训练数据

我正在尝试对一些数据进行线性回归。这就是数据的外观。 …