投票、堆叠和评分算法之间的区别是什么?

我正在为一个可能有多种分类器的问题编写机器学习解决方案,这取决于数据。因此,我收集了几种分类器,每种分类器在某些条件下表现得比其他分类器更好。我正在研究元分类策略,发现有几种算法。能有人指出它们之间的根本区别吗?


回答:

投票算法是一种简单的策略,你通过聚合分类器的决策结果来实现,例如选择在大多数情况下出现的类别。堆叠/评分策略是这种概念的泛化。不仅仅是简单地说“好的,我有一个方案v,我将用它在我的k个分类器中选择最佳答案”,你创建了另一个抽象层,在这里你实际上是学习如何根据k个投票来预测正确的标签。

简而言之,基本的投票/堆叠/评分方法可以概括为:

  • 投票 – 你有一个固定的方法v,给定答案a_1,...,a_k,结果为a=v(a_1,...,a_k)
  • 堆叠 – 你将答案用作问题的新的表示形式,因此对于每个(x_i,y_i),你得到(a_i_1,...,a_i_k),从而创建训练样本((a_i_1,...,a_i_k),y_i),并在此基础上训练元分类器
  • 评分 – 你为每个k个分类器训练一个单独的元分类器,以预测其对当前点的“分类评分”,并用它来做出决策

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注