封装到掩码pd.数据帧数据

zorro-df的Python项目详细描述


codecov

zorro logo

佐罗DF

zorrodf是一个python包,用于屏蔽pandas数据帧对象,以便 匿名化数据。它允许您去掉可识别的列名和字符串 值,将其替换为通用命名约定。程序包已生成 在scikit learn transformer框架下,因此可以插入任何 scikit学习管道。在

包源代码可以在http://github.com/epw505/zorro_df

入门

要求

pandas>=0.25.3
scikit-learn>=0.22.1

安装

Zorro DF可以使用pip和以下命令进行安装:

^{pr2}$

示例

一旦安装了包,就可以将zorrodf加载到python会话中 并使用Masker对象来屏蔽数据。在

from zorro_df import mask_dataframe as mf

example_masker = mf.Masker()
example_masker.fit(data)
masked_data = example_masker.transform(data)

测试

zorrodf的测试套件是使用pytestpytest-mock构建的 插件。按以下步骤安装两个。在

pip install pytest
pip install pytest-mock

一旦安装了测试套件,就可以从的根目录运行测试套件 佐罗Df。在

pytest tests/

未来发展

  • 恢复原始数据屏蔽
  • 附加数值缩放技术

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
运行ClassSpy java时发生反射错误   java Android ContextWrapper fileList()看不到我的文件   java使用JAXWS构建大型MTOM/XOP消息   eclipse如何使用ACM库(控制台程序)编写Java程序?   java m2eclipse插件搜索在配置为Nexus时不会给出结果   java Scanner只识别文本文件中的某些行,而不识别其他行   java如何从smartwatch启动活动或服务   java检查数组是否至少有两个具有特定值的元素   JAVA网URL编码器/解码器替代方案   Java中通过引用传递对象   spring如何在使用JavaJSON修补程序进行修补时禁止更新字段   使用java将海量数据存储到mysql的最佳方法   java字符串作为不可变对象   java我无法访问tomcat服务器(localhost),甚至无法访问mysql   java While循环条件未给出预期结果   java如何启动传递图像uri的新活动   Java中类定义在方法中的使用   Java程序在Ubuntu中运行我的另一个程序