Kedro Great使得将Great Expections与Kedro相结合变得容易!

kedro-great的Python项目详细描述


凯德罗太好了

DataEngineerOne
观看视频Kedro Great: Use Great Expectations with Ease!

Kedro Great是Kedro的一个易于使用的插件,它使得与greatexpections的集成变得快速而简单。在

Great Expectations负责。
永远不要害怕数据会再次悄然改变。在

快速入门

安装

Kedro Great可在pypi上使用,并与kedro hooks一起安装。在

pip install kedro-great

设置

一旦安装,kedro great就可以作为kedro命令使用。在

您可以使用kedro great init初始化一个远大前程项目,然后自动生成它的项目上下文。在

此外,通过使用kedro great init,您还可以生成与您的catalog.yml数据集一起使用的Datasource和{}s。在

默认情况下,预期套件以catalog.yml名称命名,并为每个套件生成一个basic.json。在

^{pr2}$

使用

在greatexpections项目被设置和配置之后,现在可以在每次管道运行时使用KedroGreat钩子来运行所有的数据验证。在

# run.pyfromkedro_greatimportKedroGreatclassProjectContext(KedroContext):hooks=(KedroGreat(),)

然后运行kedro管道来运行套房。在

kedro run

结果

最后,您可以使用great_expectations本身来生成文档并查看管道的结果。在

喜欢看那些绿色的虱子!在

great_expectations docs build

挂钩选项

KedroGreat钩子目前支持一些选项。如果你愿意的话

期望图:Dict[str,Union[str,List[str]]

如果您有多个要运行的预期套件,或有不同名称的预期套件 作为目录数据集,可以在KedroGreatexpectations_map参数中指定这些映射

Default:目录名是期望名称。在

注意:指定诸如.basic的套件类型将覆盖所有其他套件类型

KedroGreat(expectations_map={'pandas_iris_data':'pandas_iris_data','spark_iris_data':['spark_iris_data','other_expectation','another_expectation.basic'],})

套件类型:列表[可选[str]

如果您的套件有多个类型,您可以确切地选择要运行的类型。在

一个None意味着一个套件将不会在名称后面附加类型。在

默认值:KedroGreat.DEFAULT_SUITE_TYPES。在

节点:如果已经在expectations_map中指定了一个套件类型,则将覆盖此列表。在

KedroGreat(suite_types=['warning','basic',None])

在之前运行_节点:bool,在节点后运行\u:bool

您可以决定套件何时运行,在节点之前还是之后,或者同时在节点之前和之后。在

它将分别在节点inputs和{}上操作。在

Default:只在节点运行之前运行。在

KedroGreat(run_before_node=True,run_after_node=False)

fail_fast:bool,fail_after_pipeline_运行:bool

当greatexpections验证失败时,您还可以让KedroGreat抛出一个SuiteValidationFailure。在

可以立即抛出异常,也可以在整个管道运行期间聚合异常,并在最后引发异常。在

这对于希望以CI/CD方式在管道上运行验证时非常有用。在

Default:两者都未设置

KedroGreat(fail_fast=True,fail_after_pipeline_run=True)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
构造函数的java条件调用   类Dog中的java构造函数Dog不能应用于给定类型   java jsch和运行“sudo su”   java将队列和堆栈相互复制   java如何在netbeans项目的文件夹中添加库   java While循环在我的代码中不存在   如何在XML中使用java方法的返回值   java是否可以在不写入文件的情况下将字符串/字节数组作为文件发布?   java为什么这些字符串不相等?   sockets客户机-服务器java编程,用户可选择   java如何在SpringMVC和hibernate中保存模型返回视图的列表   java如何修复组织。openqa。硒。WebDriverException:未知错误   Java,Ant错误:编码Cp1252的不可映射字符   JAVAlang.ClassCastException:[Ljava.lang.String;与java.lang.String不兼容   java如何使用JDK8(可选)为空字段创建自定义IntelliJ getter模板   java Tomcat6响应。sendRedirect()404错误