我们知道现在大概有一千种分类器,最近有人告诉我,有些人说 adaboost
就像是开箱即用的那个。
- 有没有更好的算法(具有类似投票的思想)?
- 目前分类器的最新技术水平是什么?你有例子吗?
回答:
Hastie 等人(2013,《统计学习要素》)的结论是,梯度提升机是最好的“开箱即用”的方法。与你拥有的问题无关。
定义(见第 352 页):
“开箱即用”方法是指可以直接应用于数据,而无需耗费大量时间进行数据预处理或仔细调整学习过程的方法。
以及稍微早一些的说法:
事实上,Breiman(NIPS Workshop,1996)将带有树的 AdaBoost 称为“世界上最好的开箱即用分类器”(另见 Breiman(1998))。