一种解释人工智能的技术,用于回答机器学习中更广泛的问题。
gshap的Python项目详细描述
广义Shapley加法解释(G-SHAP)是一种解释人工智能以回答机器学习中广泛问题的技术。在
应用
一般分类和回归
假设我们有一个黑盒模型,它根据患者的症状诊断COVID-19、流感或普通感冒。现有的解释方法可以告诉我们为什么我们的模型诊断出一名患者患有COVID-19。G-SHAP可以回答更广泛的问题,例如区分COVID-19和流感的症状与区分COVID-19和普通感冒的症状有何不同?。在
全分析here。在
组间差异
假设我们有一个黑匣子模型,它预测罪犯再犯的风险,以确定他们是否有资格获得假释。现有的解释方法可以解释为什么我们的模型预测罪犯有很高的再犯风险。G-SHAP可以回答更广泛的问题,例如为什么我们的模型预测黑人罪犯比白人罪犯有更高的累犯率?。在
全面分析here。在
模型性能和故障
假设我们有一个基于宏观经济变量预测GDP增长的黑箱模型。现有的解释方法可以告诉我们为什么我们的模型预测3%的国内生产总值增长在一个给定的年份。G-SHAP可以回答更广泛的问题,例如为什么我们的模型未能预测2008-2009年的金融危机?。在
全面分析here。在
安装
$ pip install gshap
快速启动
在这里,我们训练一个支持向量分类器来预测罪犯是否会在刑满释放后两年内再犯罪。我们用G-SHAP来问为什么我们的模型预测黑人罪犯比非黑人罪犯更有可能再犯罪。在
^{pr2}$输出:
array([ 0.01335252, 0.24884556, 0.00132373, -0.0025238 , -0.00151837,
0.40453822, 0.01636782, 0.07666043, -0.00056414, 0.00966583])
G-SHAP值之和是预测再犯率的相对差。该模型预测,黑人罪犯再犯的可能性要高出75%。在
造成这种差异的最主要的变量是前科人数(指数5;40%)、年龄(指数1;25%)和种族(指数7;8%)。在
引文
@software{bowen2020gshap,
author = {Dillon Bowen},
title = {Generalized Shapley Additive Explanations},
url = {https://dsbowen.github.io/gshap/},
date = {2020-05-19},
}
许可证
用户必须在使用本软件的任何出版物中引用G-SHAP。在
G-SHAP是由麻省理工学院License授权的。在
- 项目
标签: