封装到掩码pd.数据帧数据
zorro-df的Python项目详细描述
佐罗DF
zorrodf是一个python包,用于屏蔽pandas数据帧对象,以便 匿名化数据。它允许您去掉可识别的列名和字符串 值,将其替换为通用命名约定。程序包已生成 在scikit learn transformer框架下,因此可以插入任何 scikit学习管道。在
包源代码可以在http://github.com/epw505/zorro_df
入门
要求
pandas>=0.25.3
scikit-learn>=0.22.1
安装
Zorro DF可以使用pip
和以下命令进行安装:
示例
一旦安装了包,就可以将zorrodf加载到python会话中 并使用Masker对象来屏蔽数据。在
from zorro_df import mask_dataframe as mf
example_masker = mf.Masker()
example_masker.fit(data)
masked_data = example_masker.transform(data)
测试
zorrodf的测试套件是使用pytest
和pytest-mock
构建的
插件。按以下步骤安装两个。在
pip install pytest
pip install pytest-mock
一旦安装了测试套件,就可以从的根目录运行测试套件 佐罗Df。在
pytest tests/
未来发展
- 恢复原始数据屏蔽
- 附加数值缩放技术
- 项目
标签: