用于处理数据fas的多进程Python/numy代码

import numpy as np from multiprocessing import Pool def myhdf(date): ii = dates.index(date) year = date[0:4] month = date[4:6] day = date[6:8] rootdir = 'data/mydata/' filename = 'no2track'+year+month+day records = read_my_hdf(rootdir,filename) if records.size: results[ii] = np.mean(records) dates = ['20080105','20080106','20080107','20080108','20080109'] results = np.zeros(len(dates)) pool = Pool(len(dates)) pool.map(myhdf,dates)

2条回答

网友

1楼 · 编辑于 2024-07-04 17:23:09

请尝试joblib以获得更友好的multiprocessing包装：

from joblib import Parallel, delayed

def myhdf(date):
    # do work
    return np.mean(records)

results = Parallel(n_jobs=-1)(delayed(myhdf)(d) for d in dates)

网友

2楼 · 编辑于 2024-07-04 17:23:09

Pool classesmap函数类似于标准的python库map函数，您可以保证按照放入结果的顺序返回结果。知道了这一点，唯一的另一个诀窍就是你需要以一致的方式返回结果，然后过滤它们。在

import numpy as np
from multiprocessing import Pool

def myhdf(date):
    year    = date[0:4]
    month   = date[4:6]
    day     = date[6:8]
    rootdir = 'data/mydata/'
    filename = 'no2track'+year+month+day
    records = read_my_hdf(rootdir,filename)
    if records.size:
        return np.mean(records)

dates = ['20080105','20080106','20080107','20080108','20080109']

pool = Pool(len(dates))
results = pool.map(myhdf,dates)
results = [ result for result in results if result ]
results = np.array(results)

如果您真的想在结果可用时立即使用imap_unordered

相关问题更多 >

编程相关推荐

热门问题

热门文章