一般情况下,我们会使用df.drop('column_name', axis=1)
来删除DataFrame中的一列。我想将这个转换器添加到Pipeline中
示例:
numerical_transformer = Pipeline(steps=[('imputer', SimpleImputer(strategy='mean')), ('scaler', StandardScaler(with_mean=False)) ])
我该怎么做?
回答:
您可以将Pipeline
封装到ColumnTransformer
中,这样可以选择通过Pipeline处理的数据,方法如下:
注意:这里我使用了正则表达式模式来排除列A
。