使用zipcodelevel普查数据快速检查种族偏见

zipbiaschecker的Python项目详细描述


zipbiaschecker公司

评估算法种族偏见的一个挑战是有时数据丢失(例如,不是作为注册表格的一部分收集的)或由于隐私原因而不可用。在这些情况下,zipcode电平偏差是一种间接测量。我们可以更进一步,通过分析包含种族人口统计数据的人口普查数据,按邮政编码。这个包通过查看算法输出与该邮政编码中黑人、西班牙裔和土著人百分比之间的相关性,帮助运行这种间接检查。在

安装

可以使用以下命令安装此软件包:

pip install zipbiaschecker

示例

在本例中,数据取自20年7月15日的Illinois Department of Public Health COVID statistics。我们将研究邮政编码检测阳性率与邮政编码人口统计学之间的相关性,以检验COVID对少数民族的不同影响。在

^{pr2}$
(646, 4)

为了解释下面的单元格,我们发现阳性病例率与邮政编码中黑人的比例约为0.278,与邮政编码中西班牙裔人口的比例为0.585,与邮政编码中土著人的比例为0.108。在

zip_bias_checker=zbc.ZipBiasChecker()zip_bias_checker.check_bias(df,zip_col_name='Zip',target_col_name='positive_rate')
1 row(s) could not be matched out of 646

percent_black         0.277773
percent_hispanic      0.585238
percent_indigenous    0.107945
Name: positive_rate, dtype: float64

用于生成参考数据的过程的文档笔记本

notebooks文件夹中,将邮政编码映射到人口统计数据的过程记录在Jupyter笔记本中。要运行笔记本,请克隆此存储库以获取使用的数据。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Windows 8.1上的netbeans 7 Java控制面板   在另一台设备上创建的将安卓设备连接到WiFi热点的java   java领域生命周期处理安卓中的关闭/无效实例   使用firebasemlkit访问cloud vision api时关闭javasocket   jsp中基于64字节数组的Java图像显示   每次方向更改并丢失字段值时,java Android OnCreateView调用两次   如何使用idljmavenplugin生成java文件   并发性如何进行同步以防止java冲突。util。ConcurrentModificationException   Java中非连通无向图的圈检测   java如何在不使用列表或集合方法的情况下删除数组元素   计算三维SAT碰撞法向量时出现java错误   java翻译自定义通知字符串   java如何从HttpURLConnection读取json数据   java如何将整数添加到字符串ArrayList?   java cxf生成的wsdl:将soap地址位置协议更改为https   jakarta ee Java:Java ee应用程序中的静态和线程安全   java在Android中传递变量   组合框的swing Java selectionChange侦听器