验证pandas对象,如dataframe和series。
pandas_validator的Python项目详细描述
验证pandas对象,如dataframe和series。 这可以定义类似django form类的验证器。
为什么在与熊猫的数据争用中会出现错误
当我们与pandas争用数据时,我们经常使用dataframe。 数据帧非常强大,易于处理。 但是dataframe没有它的模式,所以它允许不规则的值,而不需要注意它。 我们对这些值感到困惑,并影响数据争用的结果。
pandas schema提供验证dataframe或series对象和生成工厂数据的功能。
概述
importpandasaspdimportpandas_validatoraspvclassSampleDataFrameValidator(pv.DataFrameValidator):row_num=5column_num=2label1=pv.IntegerColumnValidator('label1',min_value=0,max_value=10)label2=pv.FloatColumnValidator('label2',min_value=0,max_value=10)validator=SampleDataFrameValidator()df=pd.DataFrame({'label1':[0,1,2,3,4],'label2':[5.0,6.0,7.0,8.0,9.0]})validator.is_valid(df)# True.df=pd.DataFrame({'label1':[11,12,13,14,15],'label2':[5.0,6.0,7.0,8.0,9.0]})validator.is_valid(df)# False.df=pd.DataFrame({'label1':[0,1,2],'label2':[5.0,6.0,7.0]})validator.is_valid(df)# False
开始
要求
- 支持python版本:2.7、3.4、3.5、3.6
- 支持熊猫版本:0.18、0.19
安装
$ pip install pandas_validator
0.5.0(2017-01-06)
- 添加lambdColumnValidator
- 添加IndexValidator
- .validate(df)方法已弃用。请使用.is_valid(df, raise_exception=True)
0.4.0(2015-10-28)
- 热修复:不能包含源文件
0.3.2(2015-10-28)
- python 2.7、3.2、3.3、3.4、3.5支持
- 熊猫0.14、0.15、0.16、0.17支持
0.3.1(2015-10-28)
- 更新支持python版本
- 更新依赖项库版本
0.3.0(2015-07-15)
- 关键错误修复
0.2.0(2015-05-24)
- 支持字符类型验证
- 薄片8测试
0.1.0(2015-05-22)
初次发布。
- 支持整数序列验证器
- 支持float系列验证器
- 支持数据帧验证程序
- 在python2.7和python 3.4上测试
0.0.0(2015-05-17)
创建此项目。