如果从梯度提升模型中获得0到1之间的连续预测,与从逻辑回归中得出的概率相比,这两者的含义有什么不同?
例如,如果我的逻辑回归模型对变量Y的预测输出为0.6,而我的梯度提升模型对变量Y的预测输出为0.7,那么更高的数值是否有任何意义?
回答:
GBM和逻辑回归都是概率分类器;这意味着这两个模型的输出可以(并且通常是)被解释为概率。因此,它们的输出含义实际上没有区别。
更高的数值是否有任何意义?
在这里,“意义”并不是合适的术语;在你的例子中,仅仅是GBM对特定样本的类别概率做出了不同的估计(可能是更高、更低或大致相等)。由于这两种算法不同,它们对同一样本的概率估计可以(并且通常会)有所不同,这是合乎逻辑的。