如何通过环境变量指定dask客户机

2024-05-11 07:16:52 发布

您现在位置:Python中文网/ 问答频道 /正文

如何指示dask使用分布式的Client作为调度程序,从代码外部(例如通过环境变量)执行?你知道吗

其动机是利用dask的一个关键特性,即从单机到分布式集群的透明性。然而,似乎有一点模糊了这种透明性——需要通过代码注册Client。你知道吗

我可以通过config(file/env var)将命名的调度程序(例如“synchronous”和“processes”)设置为instructed here,但是如何使用与分布式调度程序相同的机制呢?你知道吗

理想情况下,我想设置如下内容:

DASK_SCHEDULER=distributed(scheduler_file=...)

作为一个环境变量,相当于在client = Client(scheduler_file=...)python代码中运行client = Client(scheduler_file=...)。你知道吗

这意味着完全相同的代码可以在不同的环境(本地和分布式)中运行。你知道吗


Tags: 代码程序client利用环境变量分布式特性调度