使用“0”初始化群集时指定连接器版本簇.创建'应用程序接口

2024-10-01 04:46:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用Python中的clusters.createAPI在Dataproc中创建集群。你知道吗

{
 "projectId": "my-project-id",
 "clusterName": "example-cluster",
 "config": {
"configBucket": "",
"gceClusterConfig": {
  "subnetworkUri": "default",
  "zoneUri": "us-central1-b"
},
"masterConfig": {
  "numInstances": 1,
  "machineTypeUri": "n1-standard-4",
  "diskConfig": {
    "bootDiskSizeGb": 500,
    "numLocalSsds": 0
  }
},
"workerConfig": {
  "numInstances": 2,
  "machineTypeUri": "n1-standard-4",
  "diskConfig": {
    "bootDiskSizeGb": 500,
    "numLocalSsds": 0
  }
},
"initializationActions": [
  {
    "executableFile": "gs://cloud-example-bucket/my-init-action.sh"
   }
  ]
 }
 }

在gcloud shell中,连接器版本和可执行文件指定为:

gcloud dataproc clusters create <CLUSTER_NAME> \
    --initialization-actions gs://dataproc-initialization- 
    actions/connectors/connectors.sh \
    --metadata 'gcs-connector-version=1.7.0' \
    --metadata 'bigquery-connector-version=0.11.0'

如何将连接器版本(在元数据下)传递给API。你知道吗

在不传递版本的情况下运行脚本会出现以下错误:

ERROR: None of connector versions are specified' ERROR: None of connector versions are specified + exit 1


Tags: 版本gsconnectorexamplemyshstandardclusters
1条回答
网友
1楼 · 发布于 2024-10-01 04:46:26

元数据字段可以在config/gceClusterConfig下指定,如下所示:

'config': {
        'gceClusterConfig': {
             "metadata": {
                 "bigquery-connector-version": "0.12.1",
                 "gcs-connector-version": "1.8.1"
                         }
                       }
          }

相关问题 更多 >