Dataflow Flex模板验证失败，未给出原因

with beam.Pipeline(options=options) as p: read_from_avro = p \ | 'ReadFromAvro' >> ReadFromAvro(input_file) redact_data = read_from_avro | "RedactData" >> IdentifyRedactData(project, redact_fields) redact_data | 'WriteToAvro' >> WriteToAvro( file_path_prefix=output_file, schema=s, codec='deflate', file_name_suffix='.avro')

2条回答

网友

1楼 · 编辑于 2024-06-26 08:34:40

固定的。我认为问题源于管道选项配置不当。我还根据FlexWordCount示例更改了管道的运行方式

    options = PipelineOptions(beam_args)
    options.view_as(SetupOptions).save_main_session = True
    p = beam.Pipeline(options=options)

    project = options.get_all_options().get('project')

    read_from_avro = p \
                     | 'ReadFromAvro' >> ReadFromAvro(input_file)

    redact_data = read_from_avro | "RedactData" >> IdentifyRedactData(project, redact_fields)

    redact_data | 'WriteToAvro' >> WriteToAvro(
                    file_path_prefix=output_file,
                    schema=table_schema,
                    codec='deflate')

    result = p.run()
    result.wait_until_finish()

网友

2楼 · 编辑于 2024-06-26 08:34:40

从作业详细信息中，您可以导航到云日志记录。显示的默认日志集可能不包含错误，因此我建议更改过滤器以显示所有日志

相关问题更多 >

编程相关推荐

热门问题

热门文章

Dataflow Flex模板验证失败，未给出原因

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >