美国人口普查数据的误差分析
census-error-analyzer的Python项目详细描述
分析美国人口普查数据的误差幅度
功能
- 统计差异检验
- 统计范围
- 替代置信水平转换
安装
$ pipenv install census-error-analyzer
用法
导入库。
>>> import census_error_analyzer
检验统计差异
考虑到两个值各自的误差范围,它们在统计学上是否不同?人口普查局建议对所有的比较都进行这项测试。此测试回答问题并返回true或false。
接受两个列表,每个列表都应该是一对,其中包含一个值及其误差范围。
>>> us_medianage, us_medianage_moe = 37.9, 0.1 >>> nyc_medianage, nyc_medianage_moe = 38.4, 0.1 >>> census_error_analyzer.is_statistically_different( >>> (us_medianage, us_medianage_moe), >>> (nyc_medianage, nyc_medianage_moe) >>> ) True
也可以访问精确的差异。根据人口普查局的数据,大于1.0的数值可以被认为具有统计学意义。
>>> census_error_analyzer.statistical_difference( >>> (us_medianage, us_medianage_moe), >>> (nyc_medianage, nyc_medianage_moe) >>> ) 3.535533905932737
获取统计范围
估计的统计范围内的最小值和最大值,给出其误差范围。需要两个参数:首先是估计值。第二误差范围。
>>> census_error_analyzer.statistical_range(us_medianage, us_medianage_moe) 37.8, 38.0
转换为替代置信水平
人口普查公布的误差幅度在90%的置信水平。可以使用此库中的工具将它们转换为95%和99%级别。
>>> census_error_analyzer.convert_to_95_percent_confidence(3778) 4501.446808510638 >>> census_error_analyzer.convert_to_99_percent_confidence(3778) 5925.373860182372
参考文献
本单元的设计符合人口普查局2018年4月18日的演示文稿“Using American Community Survey Estimates and Margin of Error.”