我制作了一个简短的Jupyter笔记本来配合我关于TransformedTargetRegressor的问题。
我想在管道中放置一个转换器来调整参数网格,但得分不匹配。
...model = linear_model.LinearRegression()lg_tr = preprocessing.FunctionTransformer(func=np.log, inverse_func=np.exp, check_inverse=True)y_log = lg_tr.transform(y)score_0 = model.fit(X, y_log).score(X, y_log)
...model = compose.TransformedTargetRegressor(func=np.log, inverse_func=np.exp, check_inverse=True, regressor=linear_model.LinearRegression())score_1 = model.fit(X, y).score(X, y)
score_0
的值是正确的。为什么score_1
的不是?
我对预测没有问题,预测工作得很好,只是得分有问题。
我是不是遗漏了什么?
谢谢你 =)
回答:
通常情况下,你应该关注模型在预测实际值时的表现(或得分),这些值是在其原始范围或尺度上。这正是你通过score_1
测量的,而不是score_0
。
score_0
代表模型在目标变量为对数尺度时的表现,这在大多数情况下不是很有用。
然而,score_1
使用TransformedTargetRegressor
的score
方法,该方法确保在计算任何性能指标之前将目标变量转换回其原始尺度。因此,判断应基于score_1
进行。