一个建立在气流之上的ETL自以为是的框架

gust的Python项目详细描述


阵风

每一个任务的数据都是由一个数据流在一个数据流框架中建立起来的。查看gusty demo以获取使用gusty的完全对接数据管道的示例!在

结构

在气流DAGs中生成作业的.yml方法并不是一个新的想法,但它是有用的,并且有一些内置的好处。在

  • Dependencies-可以通过以下三种方法之一在.yml文件中快速设置依赖项:

    1. 使用dependencies规范,可以设置同一DAG中作业之间的依赖关系。在
    2. 使用external_dependencies规范,可以设置不同DAG中作业之间的依赖关系。在
    3. 对于MaterializedPostgresOperator,属于views模式一部分的同一个DAG中的依赖项被自动注册。在
  • Operator configuration-构建运算符后,可以在每个.yml作业定义文件中向其传递参数。这意味着,例如,如果必须调用不同的API端点,则可能只需要构建一个运算符来从该API中摄取数据,然后可以在.yml作业定义文件中指定要调用的端点。在

  • 支持流行的笔记本格式-目前有两个notebook操作符,RmdOperator和{},它们使您能够简单地编写RMarkdown或Jupyter笔记本文件,并将它们作为作业部署到数据管道中。更重要的是,RmdOperator和{}实际上在单独的专用docker容器上执行,并通过SSH与气流容器交互,如果您想在云中单独部署这些服务,这非常有用!在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java使用无循环和乘法的递归调用查找值   java字符串大小冲突   在一组Java文件对象中查找唯一的超级目录   没有Eclipse控制台输出窗口(Java)?   java这怎么等于105而不是15?   java Adempiere列调出,用于不处理从(代码)选项导入和创建行的字段   java tomcat、2个webapps、2个log4js,但这两个应用都记录到一个文件中   lambda理解Java谓词   HotspotFX上的Java EOF问题   java google应用程序引擎:如何向连接/断开通道“ping”添加信息?   java如何使用VTDXML获取一个元素的所有名称空间声明?   java如何使用drawLine()获得一条线以随机方向拍摄?   java transactionManager应该使用哪个SessionFactory?   java在安卓上播放声音   在Mac上使用JBDC对SQL Server进行java Windows身份验证   java基本列表和字符串[]   java NamedParameterJdbcTemplate从中选择*   扩展上的java Android可扩展列表视图   使用ApacheAxis2的java SOAP附件