在使用装袋集成技术时,如果我设置n_estimator=500
,max_sample=1.0
,和bootstrap=True
,那么这是否等同于设置n_estimator=500
,和bootstrap=False
?因为在两种情况下,预测器只会接收到500个训练实例的一个样本。假设训练实例的数量为500。
回答:
不,这是不等同的。
当你设置bootstrap=False
时,你实际上是在说每个弱估计器都应该使用训练集中每个数据点训练一次。
当你设置bootstrap=True
时,你是在进行有放回抽样,这意味着某些数据点可能会被使用多次,而另一些则可能不会被使用。max_samples
只是用来确定从哪个数据分数中进行 bootstrapping 的方式。