投票、堆叠和评分算法之间的区别是什么?

我正在为一个可能有多种分类器的问题编写机器学习解决方案,这取决于数据。因此,我收集了几种分类器,每种分类器在某些条件下表现得比其他分类器更好。我正在研究元分类策略,发现有几种算法。能有人指出它们之间的根本区别吗?


回答:

投票算法是一种简单的策略,你通过聚合分类器的决策结果来实现,例如选择在大多数情况下出现的类别。堆叠/评分策略是这种概念的泛化。不仅仅是简单地说“好的,我有一个方案v,我将用它在我的k个分类器中选择最佳答案”,你创建了另一个抽象层,在这里你实际上是学习如何根据k个投票来预测正确的标签。

简而言之,基本的投票/堆叠/评分方法可以概括为:

  • 投票 – 你有一个固定的方法v,给定答案a_1,...,a_k,结果为a=v(a_1,...,a_k)
  • 堆叠 – 你将答案用作问题的新的表示形式,因此对于每个(x_i,y_i),你得到(a_i_1,...,a_i_k),从而创建训练样本((a_i_1,...,a_i_k),y_i),并在此基础上训练元分类器
  • 评分 – 你为每个k个分类器训练一个单独的元分类器,以预测其对当前点的“分类评分”,并用它来做出决策

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注