benfordslaw将测试经验(观察)分布是否与理论(预期,Benfords)分布有显著差异。
benfordslaw的Python项目详细描述
本福德斯劳
- 在
在benfordslaw
是Python包,用于测试经验(观察到的)分布是否与理论(预期的,Benfords)分布有显著差异。该定律指出,在许多自然出现的数字集合中,前导有效数字可能很小。如果你想测试你的一组数字是否是人工的(或人工制造的),可以使用这个方法。如果某一组值遵循Benford定律,那么相应预测值的模型也应该遵循Benford定律。正常数据(未经处理)符合本福德定律,而被操纵或欺诈数据则不符合。在 - 在
数据假设:
- 这些数字必须是随机的,不分配,没有强制的最小值或最大值。在
- 这些数字应该包括几个数量级
- 数据集最好包含至少1000个样本。尽管Benford定律已经被证明适用于只有50个数字的数据集。在
安装
- 从PyPI安装
benfordslaw
(推荐)。benfordslaw与python3.6+兼容,可以在Linux、macosx和Windows上运行。在 - 它是根据麻省理工学院的许可证发行的。在
安装
pip install benfordslaw
- 或者,从GitHub源安装benfordslaw:
^{pr2}$
导入benfordslaw包
frombenfordslawimportbenfordslaw# Initializebl=benfordslaw()# Load elections exampledf=bl.import_example(data='USA')# Extract election information.X=df['votes'].loc[df['candidate']=='Donald Trump'].values# Printprint(X)# array([ 5387, 23618, 1710, ..., 16, 21, 0], dtype=int64)# Make fitresults=bl.fit(X)# Plotbl.plot(title='Donald Trump')
pip install benfordslaw
在
引文
如果这对你的研究有用,请在你的出版物中引用本福德斯劳。以下是BibTeX条目示例:
@misc{erdogant2020benfordslaw,title={benfordslaw},author={Erdogan Taskesen},year={2019},howpublished={\url{https://github.com/erdogant/benfordslaw}},}
参考文献
- https://en.wikipedia.org/wiki/Benford%27s_law
- https://towardsdatascience.com/frawd-detection-using-benfords-law-python-code-9db8db474cf8
维护人员
标签:
- 项目
标签: