我最近在进行一个使用libLinear作为核心的分类工作。我已经训练了两种类型的特征集,并将其用于两个模型来对查询输入进行预测。为了利用后期融合来结合两个模型的结果,我修改了liblinear的代码,以便能够获取不同类别的决策分数。因此,我们得到了两组分数来决定查询应属于哪个类别。
进行这种“后期融合”是否有标准的方法,还是直观地将每个类别的两个分数相加,并选择分数最高的类别作为候选?
回答:
结合多个分类器的标准方法是对各个分类器的分数进行加权求和。当然,这样做时你需要解决如何指定权重系数的问题。有几种不同的可能性:
- 统一设置权重
- 根据分类器的性能比例设置权重
- 训练一个新的分类器,将这些分数作为输入