Home IT技术可解释机器学习中Shapley值与SHAP值的区别

可解释机器学习中Shapley值与SHAP值的区别

IT技术 xiaolong · 2025年5月25日 · 0 Comment

这篇论文关于shap包在(4)中给出了Shapley值的公式，而在(8)中显然是SHAP值的公式

我仍然不太明白Shapley值和SHAP值之间的区别。据我所知，对于Shapley值，我需要在每个可能的参数子集上重新训练我的模型，而对于SHAP值，我只使用在所有参数上训练的基本模型。就是这样吗？所以SHAP在计算上更容易？

回答：

SHAP结合了其他不可知方法的局部可解释性（例如LIME，其中模型f(x)被局部近似为每个因子X的每个实例的可解释模型g(x)）和Shapley值的博弈论方法。这导致了一些理想的特性（局部准确性、缺失性、一致性）。

请记住，在公式(4)中缺少“局部”，Shapley（回归）值为因子X（作为一个整体）分配一个贡献分数。在公式(8)中，我们看到SHAP现在是x的函数。这意味着我们为每个因子以及特别是因子Xi的每个实现实例xi获得一个贡献，这使得它局部可解释并继承了理想的特性。

因此，SHAP可以被理解为LIME（或相关概念）和Shapley值的结合。最终，SHAP值只是“原始模型的条件期望函数的Shapley值”Lundberg和Lee (2017)。基本上，Shapley值适用于任何值函数，而SHAP只是通过值函数的特殊定义成为Shapley值的一个特例！

我和你有同样的问题，这是我对Lundberg和Lee (2017)论文的直观理解。希望这对你有帮助。

machine-learning reshape

发表回复取消回复