我是一个Python和Scikit的新手。我已经用Scikit创建了两个逻辑回归模型,我想将它们结合起来得到一个新的模型。我心中的想法是这样的:
clf1 = LogisticRegression()clf1.fit(X_set, Y_set)clf2 = LogisticRegression()clf2.fit(X_set, Y_set)combined_clf = clf1 + clf2
但我不知道该怎么做。提前感谢大家。
回答:
这里有两种方法可能适合你的需求。
第一种方法是让每个分类器对预测的类别进行投票。为此,你可以使用sklearn.ensemble.VotingClassifier。以你的例子为例:
from sklearn.ensemble import VotingClassifierclf1 = LogisticRegression()clf2 = LogisticRegression()eclf1 = VotingClassifier(estimators=[('lr1', clf1), ('lr2', clf2)],voting='hard')eclf1 = eclf1.fit(X, Y)
另一种方法是堆叠。基本思路是结合多个分类器的输出,并在这些初级分类器的输出上训练一个元分类器。
这里有一个描述该方法的有用链接:https://rasbt.github.io/mlxtend/user_guide/classifier/StackingClassifier/。
使用mlxtend和你的例子:
from mlxtend.classifier import StackingClassifierclf1 = LogisticRegression()clf2 = LogisticRegression()lr = Your_Meta_Classifier()sclf = StackingClassifier(classifiers=[clf1, clf2], meta_classifier=lr)
然而,在你的例子中,模型使用相同的确定性方法进行训练,我认为堆叠它们不会带来任何改进。
希望这对你有帮助!
(哦,可能与以下问题重复:使用scikit-learn(或任何其他Python框架)结合不同类型的回归器的集成?)