AWS Sagemaker |为什么多个实例的训练时间成倍增加到实例数

from sagemaker.estimator import Estimator hyperparameters = {'train-steps': 10} instance_type = 'ml.m4.xlarge' estimator = Estimator(role=role, train_instance_count=1, train_instance_type=instance_type, image_name=ecr_image, hyperparameters=hyperparameters) estimator.fit(data_location)

1条回答

网友

1楼 · 发布于 2024-09-25 04:28:31

您在脚本中使用TensorFlow estimator APIs？如果是的话，我认为您应该按照in the documentation here所述将其包装在sagemaker.tensorflow.TensorFlow类中来运行脚本。如果以这种方式运行培训，那么实例之间的并行化和通信应该是开箱即用的。在

但请注意，当增加实例数时，缩放将不是线性的。实例之间的通信需要时间，而且脚本中可能存在不可并行化的瓶颈，例如将数据加载到内存中。在

编程相关推荐

Java中的Hashmaps帮助
java从适配器类扩展类
静态重新初始化Java类
SnakeYAML scala中的java YAML环境变量插值
java如何避免番石榴存放未使用的许可证？
JDBC中PostgreSQL的java“无效数据库地址”
SonarQube中使用Java的MethodInvocationTree用法
java如何使用反射更改属性值
web服务在Java中将多个InputStream写入OutputStream？
java类序列化帮助（org.omg.CORBA.MARSHAL:WARNUNG:IOP00810011:异常…错误）

相关问题更多 >

编程相关推荐

热门问题

热门文章