并行化列upd

import numpy as np import pandas as pd from scipy.ndimage import distance_transform_edt as edt for i in df0['parcels'].values: y, x = np.where(parcels == i) tmp = parcels[np.min(y) - 5:np.max(y) + 6, np.min(x) - 5:np.max(x) + 6] dst = edt(tmp, sampling=r_parcels) par = tmp[dst <= 20] par = par[par != -9999] mod, cnt = ss.mode(par) df['parcels'] = df['parcels'].replace(i, mod[0])

1条回答

网友

1楼 · 发布于 2024-06-02 14:07:48

您可以使用多处理中提供的池进行并行化。你知道吗

import numpy as np
import pandas as pd
from scipy.ndimage import distance_transform_edt as edt

import multiprocessing as mp

def func(i): # change the body of the loop to function
    y, x = np.where(parcels == i)
    tmp = parcels[np.min(y) - 5:np.max(y) + 6, np.min(x) - 5:np.max(x) + 6]
    dst = edt(tmp, sampling=r_parcels)
    par = tmp[dst <= 20]
    par = par[par != -9999]
    mod, cnt = ss.mode(par)
    return (df['parcels'].replace(i, mod[0]))

num_workers = mp.cpu_count()  
pool = mp.Pool(num_workers)
df['parcels'] = pool.map(func,df0['parcels'].values) # specify the function and arguments to map 
pool.close()
pool.join()

您也可以使用pool.map\u异步（）或pool.apply\u异步（）因为map（）正在阻塞。一般来说，并行化的逻辑保持不变。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章