在LightGBM的文档中提到,可以通过设置predict_contrib=True
来预测SHAP值。
我们如何提取SHAP值(除了使用shap
包之外)?
我尝试过
model = LGBM(objective="binary",is_unbalance=True,predict_contrib=True)model.fit(X_train,y_train)pred_shap = opt_model.predict(X_train) #无法获取SHAP值
似乎不起作用
回答:
使用LGBM
和pred_contrib=True
获取SHAP值的方法:
from lightgbm.sklearn import LGBMClassifierfrom sklearn.datasets import load_irisX,y = load_iris(return_X_y=True)lgbm = LGBMClassifier()lgbm.fit(X,y)lgbm_shap = lgbm.predict(X, pred_contrib=True)# 返回的LGBM shap值的形状:4个特征 x 3个类别 + 3个训练数据集上的期望值print(lgbm_shap.shape)# 第0行的LGBM shap值,第0个特征print(lgbm_shap[0,:4])
输出:
(150, 15)[-0.0176954 0.50644615 5.56584344 3.43032313]
来自shap
的SHAP值:
import shapexplainer = shap.TreeExplainer(lgbm)shap_values = explainer.shap_values(X)# 预测类别的数量print(len(shap_values))# 第0类别第0行的shap值print(shap_values[0][0])
输出:
3array([-0.0176954 , 0.50644615, 5.56584344, 3.43032313])
在我看来是一样的。