我想知道我们是否可以在sklearn.pipeline
中设置一个“可选”的步骤。例如,对于一个分类问题,我可能想尝试在ExtraTreesClassifier
之前是否进行PCA
变换。在实践中,这可能是一个带有额外参数的管道,用于指定PCA
步骤的开关,以便我可以通过GridSearch
等进行优化。我在sklearn的源码中没有看到这样的实现,但有没有什么变通的方法呢?
此外,由于管道中后续步骤的可能参数值可能依赖于前一步的参数(例如,ExtraTreesClassifier.max_features
的有效值依赖于PCA.n_components
),是否可以在sklearn.pipeline
和sklearn.grid_search
中指定这种条件依赖关系呢?
谢谢!
回答: