用于数据合成和评估的Python库
ds4ml的Python项目详细描述
最近实施的数据隐私保护法规,如GDPR, 使得数据共享更加困难。此工具旨在简化数据 通过基于原始数据集合成数据集从客户共享 用于以后的机器学习。在
此工具有两个部分:
- 数据合成器 基于原始数据集合成数据集。它接受CSV数据作为 输入并输出基于差异隐私的合成数据集。这个 该算法在数据合成器中的应用可供本文参考( http://dimacs.rutgers.edu/~graham/pubs/papers/privbayes-tods.pdf)。在
- 数据效用评估 评估合成数据集的数据实用程序。原始数据集 并以合成的数据集为输入,生成一份效用评价报告 生成多个指标。在
- 项目
标签: