可解释性没有数学上的定义。我比较喜欢Miller[2] 的非数学的定义:可解释性是指人们能够理解决策原因的程度。另一种定义是[3]:可解释性是指人们能够一致地预测模型结果的程度。机器学习模型的可解释性越高,人们就越容易理解为什么做出某些决策或预测。如果一个模型的决策比另一个模型的决策能让人更容易理解,那么它就比另一个模型具有更好的可解释性。