如何在azureml服务计算集群上并行工作？

1条回答

网友

1楼 · 发布于 2024-09-28 01:26:10

有很多方法可以用AzureML解决这个问题。最简单的方法是使用azuremlpythonsdk启动一些作业（底层示例取自here）

from azureml.train.sklearn import SKLearn

runs = []

for kernel in ['linear', 'rbf', 'poly', 'sigmoid']:
    for penalty in [0.5, 1, 1.5]:
        print ('submitting run for kernel', kernel, 'penalty', penalty)
        script_params = {
            ' kernel': kernel,
            ' penalty': penalty,
        }

        estimator = SKLearn(source_directory=project_folder, 
                            script_params=script_params,
                            compute_target=compute_target,
                            entry_script='train_iris.py',
                            pip_packages=['joblib==0.13.2'])

        runs.append(experiment.submit(estimator))

以上要求您将培训与所需的python包一起考虑到一个脚本（或文件夹中的一组脚本）中。上面的估计器是使用sciket Learn的方便包装器。Tensorflow、Pytorch、Chainer和一个泛型（azureml.train.estimator.Estimator）也有估算器，它们在使用的Python包和基本docker中都有所不同。你知道吗

第二个选项是，如果您确实在调整参数，那么可以像这样使用HyperDrive服务（使用与上面相同的SKLearn估计器）：

from azureml.train.sklearn import SKLearn
from azureml.train.hyperdrive.runconfig import HyperDriveConfig
from azureml.train.hyperdrive.sampling import RandomParameterSampling
from azureml.train.hyperdrive.run import PrimaryMetricGoal
from azureml.train.hyperdrive.parameter_expressions import choice

estimator = SKLearn(source_directory=project_folder, 
                    script_params=script_params,
                    compute_target=compute_target,
                    entry_script='train_iris.py',
                    pip_packages=['joblib==0.13.2'])

param_sampling = RandomParameterSampling( {
    " kernel": choice('linear', 'rbf', 'poly', 'sigmoid'),
    " penalty": choice(0.5, 1, 1.5)
    }
)

hyperdrive_run_config = HyperDriveConfig(estimator=estimator,
                                         hyperparameter_sampling=param_sampling, 
                                         primary_metric_name='Accuracy',
                                         primary_metric_goal=PrimaryMetricGoal.MAXIMIZE,
                                         max_total_runs=12,
                                         max_concurrent_runs=4)

hyperdrive_run = experiment.submit(hyperdrive_run_config)

或者你可以用DASK来安排你刚才提到的工作。下面是一个如何在和AzureML Compute Cluster上设置DASK的示例，这样您就可以对它进行交互式操作：https://github.com/danielsc/azureml-and-dask

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在azureml服务计算集群上并行工作？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >