是否可以立即添加工作人员?

2024-10-01 00:26:11 发布

您现在位置:Python中文网/ 问答频道 /正文

启动TensorFlow服务器(tf.distribute.Server)时,必须传递一个ClusterSpec,它指定集群中的所有任务/工作者

在启动服务器后,是否可以向其添加更多工作人员?怎么做

若否,原因为何

(这与问题有关,why does the server need to know at all about all the workers in advance? 虽然这不是一个完全相同的问题。)

(这也与问题有关,what operators are there for remote communication?目前我只知道这个(官方的)distributed TensorFlow功能,通过带有ClusterSpec的TF服务器。 其他非官方的解决方案是,例如TensorpackTF ZMQ ops,您可以通过任何方式(通过ZeroMQ)进行通信,而且您也不需要事先了解整个集群。)


Tags: the服务器servertftensorflow集群原因all
1条回答
网友
1楼 · 发布于 2024-10-01 00:26:11

开箱即用,我认为不可能向正在运行的服务器添加更多的工作人员/任务

tf.distribute.Server class使用TensorFlow's low-level C API的服务器类。此类提供了一个UpdateServerDef method,它可能用于修改正在运行的服务器的配置,从而更改工作进程/任务

但是,这个更新方法不是通过TensorFlow python binding公开的,所以除非您愿意修改和编译自己的TensorFlow C核心,否则我认为这是不可能的

相关问题 更多 >