如何在Python中创建Azure数据工厂管道活动之间的依赖关系

def createDataFactoryRectStage(self, aPipelineName, aActivityStageName, aActivityAcquireName, aRectFileName, aRectDSName, aStageTableName, aStageDSName, aAcquireTableName, aAcquireDSName): adf_client = self.__getAdfClient() ds_blob = AzureBlobdataset(linked_service_name = LinkedServiceReference(AZURE_DATAFACTORY_LS_BLOB_RECT), folder_path=PRJ_AZURE_BLOB_PATH_RECT, file_name = aRectFileName, format = {"type": "TextFormat", "columnDelimiter": ",", "rowDelimiter": "", "nullValue": "\\N", "treatEmptyAsNull": "true", "firstRowAsHeader": "true", "quoteChar": "\"",}) adf_client.datasets.create_or_update(AZURE_RESOURCE_GROUP, AZURE_DATAFACTORY, aRectDSName, ds_blob) ds_stage= AzureSqlTableDataset(linked_service_name = LinkedServiceReference(AZURE_DATAFACTORY_LS_SQLDB_STAGE), table_name='[dbo].[' + aStageTableName + ']') adf_client.datasets.create_or_update(AZURE_RESOURCE_GROUP, AZURE_DATAFACTORY, aStageDSName, ds_stage) ca_blob_to_stage = CopyActivity(aActivityStageName, inputs=[DatasetReference(aRectDSName)], outputs=[DatasetReference(aStageDSName)], source= BlobSource(), sink= SqlSink(write_batch_size = AZURE_SQL_WRITE_BATCH_SIZE)) ds_acquire= AzureSqlTableDataset(linked_service_name = LinkedServiceReference(AZURE_DATAFACTORY_LS_SQLDB_ACQUIRE), table_name='[dbo].[' + aAcquireTableName + ']') adf_client.datasets.create_or_update(AZURE_RESOURCE_GROUP, AZURE_DATAFACTORY, aAcquireDSName, ds_acquire) dep = ActivityDependency(ca_blob_to_stage, dependency_conditions =[DependencyCondition('Succeeded')]) ca_stage_to_acquire = CopyActivity(aActivityAcquireName, inputs=[DatasetReference(aStageDSName)], outputs=[DatasetReference(aAcquireDSName)], source= SqlSource(), sink= SqlSink(write_batch_size = AZURE_SQL_WRITE_BATCH_SIZE), depends_on=[dep]) p_obj = PipelineResource(activities=[ca_blob_to_stage, ca_stage_to_acquire], parameters={}) return adf_client.pipelines.create_or_update(AZURE_RESOURCE_GROUP, AZURE_DATAFACTORY, aPipelineName, p_obj)

1条回答

网友

1楼 · 发布于 2024-10-16 20:45:17

下面是C#中的一个示例，它基本上在管道中的序列中执行Chaining activities和链接活动。还记得在ADFV1中，我们必须将一个活动的输出配置为另一个活动的输入，以将它们链接起来并使它们相互依赖。在

管道代码段（请注意dependsOn属性，该属性确保第二个活动在第一个活动成功运行后运行）-

static PipelineResource PipelineDefinition(DataFactoryManagementClient client) {
 Console.WriteLine("Creating pipeline " + pipelineName + "...");
 PipelineResource resource = new PipelineResource {
   Activities = new List < Activity > {
    new CopyActivity {
     Name = copyFromBlobToSQLActivity,
      Inputs = new List < DatasetReference > {
       new DatasetReference {
        ReferenceName = blobSourceDatasetName
       }
      },
      Outputs = new List<DatasetReference>
      {
       new DatasetReference {
        ReferenceName = sqlDatasetName
       }
      },
      Source = new BlobSource {},
      Sink = new SqlSink {}
    },
    new CopyActivity {
     Name = copyToSQLServerActivity,
      Inputs = new List < DatasetReference > {
       new DatasetReference {
        ReferenceName = sqlDatasetName
       }
      },
      Outputs = new List<DatasetReference>
      {
       new DatasetReference {
        ReferenceName = sqlDestinationDatasetName
       }
      },
      Source = new SqlSource {},
      Sink = new SqlSink {},
      DependsOn = new List < ActivityDependency > {
       new ActivityDependency {
        Activity = copyFromBlobToSQLActivity,
         DependencyConditions = new List < String > {
          "Succeeded"
         }
       }
      }
    }
   }
 };
 Console.WriteLine(SafeJsonConvert.SerializeObject(resource, client.SerializationSettings));
 return resource;
}

请查看ADFV2教程here，以获得全面的解释和更多场景。在

相关问题更多 >

编程相关推荐

热门问题

热门文章