限制Dask CPU和内存使用（单节点）

1条回答

网友

1楼 · 发布于 2024-04-25 16:22:41

Dask.distributed.Client创建一个LocalCluster，您可以为其显式设置内存使用和核心数

import numpy as np
import pandas as pd
from dask.distributed import Client
from dask import dataframe as dd

def names_unique(x):
    return x['Names'].unique()

client = Client(memory_limit='2GB', processes=False,
                n_workers=1, threads_per_worker=2)

# Data generation
df = pd.DataFrame({'Names': np.random.choice(['A', 'B', 'C', 'D'], size=1000000),
                   'sales': np.arange(1000000)})
df.to_parquet('parq_df')
ddf = dd.read_parquet('parq_df', npartitions=10)

# Custom computation
sent = client.submit(names_unique, ddf)
names_unique = sent.result().compute()
client.close()

输出：

names_unique
Out[89]: 
0    D
1    B
2    C
3    A
Name: Names, dtype: object

编程相关推荐

Java持久性和Foxpro
javajavax。命名。NameNotFoundException:com。javacodegeeks。实例服务AccountServiceRemote
java在不重复字符的情况下查找最长子字符串的长度
控制台Java runtine。执行官：不会改变路径
Java继承混乱，超类和子类成员变量同名
循环如何格式化在Java中循环的打印行
使用Jersey/Glassfish实现java正确的CDI注释
多线程Java创建一个连续线程数组
java根据特殊字符（逗号除外）验证字符串
安卓 JNI NewStringUTF调用了挂起的异常“java”。lang.NoSuchMethodError'

相关问题更多 >

编程相关推荐

热门问题

热门文章

限制Dask CPU和内存使用（单节点）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >