SparkPipelineFramework测试框架

sparkpipelineframework.testing的Python项目详细描述


Sp公司arkPipelineFramework.测试在

测试框架,它可以测试SparkPipelineFramework库,只需在运行转换器之前向安装程序提供输入文件,以及用于验证输出的输出文件

使用

  1. 创建一个类似于SparkPipelineFramework中库的文件夹结构的文件夹结构(测试框架就是这样找到要运行的转换器的)
  2. 创建一个输入文件夹并放入表示输入视图的文件。这些文件可以是csv、json或parquet
  3. (可选)创建一个input_schema文件夹,并放入要应用于上述视图的任何模式。这遵循Spark Json模式格式。在
  4. (可选)创建输出文件夹并放入表示所需输出视图的文件。这些文件可以是csv、json或parquet
  5. (可选)创建一个output_schema文件夹,并放入要应用于输出视图的任何架构
  6. 复制以下测试代码并将其放入此文件夹中的测试文件中
frompathlibimportPathfrompyspark.sqlimportSparkSessionfromspark_pipeline_framework_testing.test_runnerimportSparkPipelineFrameworkTestRunnerdeftest_folder(spark_session:SparkSession)->None:data_dir:Path=Path(__file__).parent.joinpath('./')SparkPipelineFrameworkTestRunner.run_tests(spark_session=spark_session,folder_path=data_dir)
  1. 现在运行这个测试。在

注意:测试也会在子文件夹中查找文件。在

示例

对于此处定义的转换器:https://github.com/imranq2/SparkPipelineFramework.Testing/tree/main/library/features/people/my_people_feature 你可以在这里找到测试:https://github.com/imranq2/SparkPipelineFramework.Testing/tree/main/tests/library/features/people/my_people_feature

发布新包

  1. 创建新版本
  2. GitHub操作应该自动启动并发布包
  3. 您可以在“操作”选项卡中查看状态

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java为游戏添加声音。需要帮助   java在获取数据时忽略模型类中的forign键映射   java为什么Microsoft JDBC驱动程序忽略failoverPartner主机名   java可以下载mozswing文件   java等价于ObjectOutputStream,不仅保存其状态,还保存整个对象?   Java Android LiveData根据其他LiveData调用房间查询   java如何使用jackson jsonNode实现这一点并获得所需的输出   在web服务器上作为web应用程序运行java应用程序?   groovy中java类的元类属性   返回空指针的java图形对象   标头中包含用户名和密码的java SOAP客户端请求   具有堆栈实现和递归的Hanoi算法塔(Java)   java当我运行这两个类时,我的老鼠不会移动   使用图像进行java相似图像搜索   Java8并行流机制   使用单例对象作为枚举元素的java Scala枚举,是否有可能对它们进行迭代?   java Webview更改高度大小   不可序列化对象和函数的java Spark Scala编程   java my app在eclipse中运行良好,而不是在jar中