对于CatBoost库中的一些对象(例如Python代码导出模型 – https://tech.yandex.com/catboost/doc/dg/concepts/python-reference_catboostclassifier_save_model-docpage/),预测结果(https://tech.yandex.com/catboost/doc/dg/concepts/python-reference_apply_catboost_model-docpage/)只会给出每条记录的所谓的原始分数(参数值称为”RawFormulaVal”)。其他API函数还允许预测结果为目标类的概率(https://tech.yandex.com/catboost/doc/dg/concepts/python-reference_catboostclassifier_predict-docpage/) – 参数值称为”Probability”。
我想知道
- 这与概率(在二元分类的情况下)有何关系,
- 是否可以使用Python API(https://tech.yandex.com/catboost/doc/dg/concepts/python-quickstart-docpage/)将其转换为概率?
回答:
CatBoost预测函数中类型为”RawFormulaVal”的原始分数是log-odds(https://en.wikipedia.org/wiki/Logit)。因此,如果我们应用函数”exp(score) / (1+ exp(score))”,我们将得到与使用类型为”Probability”的预测公式相同的结果,即概率。