如何指示dask使用分布式的Client
作为调度程序,从代码外部(例如通过环境变量)执行?你知道吗
其动机是利用dask的一个关键特性,即从单机到分布式集群的透明性。然而,似乎有一点模糊了这种透明性——需要通过代码注册Client
。你知道吗
我可以通过config(file/env var)将命名的调度程序(例如“synchronous”和“processes”)设置为instructed here,但是如何使用与分布式调度程序相同的机制呢?你知道吗
理想情况下,我想设置如下内容:
DASK_SCHEDULER=distributed(scheduler_file=...)
作为一个环境变量,相当于在client = Client(scheduler_file=...)
python代码中运行client = Client(scheduler_file=...)
。你知道吗
这意味着完全相同的代码可以在不同的环境(本地和分布式)中运行。你知道吗
一种方法是do add,以传递调度程序有一个参数;例如使用Argparse。 因此,如果指定distributed或<;127.0.0.1:port>;作为local,则可以使用
python my_script.py <ip:port>
。你知道吗相关问题 更多 >
编程相关推荐