使用zipcodelevel普查数据快速检查种族偏见
zipbiaschecker的Python项目详细描述
zipbiaschecker公司
评估算法种族偏见的一个挑战是有时数据丢失(例如,不是作为注册表格的一部分收集的)或由于隐私原因而不可用。在这些情况下,zipcode电平偏差是一种间接测量。我们可以更进一步,通过分析包含种族人口统计数据的人口普查数据,按邮政编码。这个包通过查看算法输出与该邮政编码中黑人、西班牙裔和土著人百分比之间的相关性,帮助运行这种间接检查。在
安装
可以使用以下命令安装此软件包:
pip install zipbiaschecker
示例
在本例中,数据取自20年7月15日的Illinois Department of Public Health COVID statistics。我们将研究邮政编码检测阳性率与邮政编码人口统计学之间的相关性,以检验COVID对少数民族的不同影响。在
^{pr2}$(646, 4)
为了解释下面的单元格,我们发现阳性病例率与邮政编码中黑人的比例约为0.278,与邮政编码中西班牙裔人口的比例为0.585,与邮政编码中土著人的比例为0.108。在
zip_bias_checker=zbc.ZipBiasChecker()zip_bias_checker.check_bias(df,zip_col_name='Zip',target_col_name='positive_rate')
1 row(s) could not be matched out of 646
percent_black 0.277773
percent_hispanic 0.585238
percent_indigenous 0.107945
Name: positive_rate, dtype: float64
用于生成参考数据的过程的文档笔记本
在notebooks
文件夹中,将邮政编码映射到人口统计数据的过程记录在Jupyter笔记本中。要运行笔记本,请克隆此存储库以获取使用的数据。在
- 项目
标签: