使用多处理时python中的慢速pickle转储

from pyomo.environ import * from pyomo.opt import SolverFactory, TerminationCondition from pyomo.opt.parallel import SolverManagerFactory import sys import multiprocessing def worker(init_nodes[i_nodo][j_nodo], data, optsolver, queue, shared_incumbent_data): #[pyomo instances solving and constraining] return def foo(model, data, optsolver, processes = multiprocessing.cpu_count()): queue = multiprocessing.Queue() process_dict = {} for i_node in range(len(init_nodes)): #init_nodes is a list containing lists of pyomo instances for j_node in range(len(init_nodes[i_node])): process_name = str(i_node) + str(j_node) print(" - Data size:", sys.getsizeof(data)) #same for all of the args process_dict[process_name] = multiprocessing.Process(target=worker, args=(init_nodes[i_nodo][j_nodo], data, optsolver, queue, shared_incumbent_data)) pr = cProfile.Profile() pr.enable() process_dict[process_name].start() pr.disable() ps = pstats.Stats(pr) ps.sort_stats('time').print_stats(5) for n_nodo in process_dict: process_dict[n_nodo].join(timeout=0) #imports #[model definition] #[data is obtained from 3 .tab files, the biggest one has a 30 x 40 matrix, with 1 to 3 digit integers] optsolver = SolverFactory("gurobi") if __name__ == "__main__": foo(model, data, optsolver, 4)

- Data size: 56 - Init_nodes size: 72 - Queue size: 56 - Shared incumbent data size: 56 7150 function calls (7139 primitive calls) in 25.275 seconds Ordered by: internal time List reduced from 184 to 5 due to restriction <5> ncalls tottime percall cumtime percall filename:lineno(function) 2 25.262 12.631 25.267 12.634 {method 'dump' of '_pickle.Pickler' objects} 1 0.004 0.004 0.004 0.004 {built-in method _winapi.CreateProcess} 1265 0.002 0.000 0.004 0.000 C:\Users\OLab\AppData\Local\Continuum\anaconda3\lib\site-packages\pyomo\core\expr\numeric_expr.py:186(__getstate__) 2 0.001 0.001 0.002 0.001 <frozen importlib._bootstrap_external>:914(get_data) 1338 0.001 0.000 0.002 0.000 C:\Users\OLab\AppData\Local\Continuum\anaconda3\lib\site-packages\pyomo\core\expr\numvalue.py:545(__getstate__)

- Data size: 56 - Init_nodes size: 72 - Queue size: 56 - Shared incumbent data size: 56 7257 function calls (7247 primitive calls) in 1.742 seconds Ordered by: internal time List reduced from 184 to 5 due to restriction <5> ncalls tottime percall cumtime percall filename:lineno(function) 2 1.722 0.861 1.730 0.865 {method 'dump' of '_pickle.Pickler' objects} 1 0.009 0.009 0.009 0.009 {built-in method _winapi.CreateProcess} 1265 0.002 0.000 0.005 0.000 C:\Users\Palbo\Anaconda2\envs\py3\lib\site-packages\pyomo\core\expr\numeric_expr.py:186(__getstate__) 1339 0.002 0.000 0.003 0.000 C:\Users\Palbo\Anaconda2\envs\py3\lib\site-packages\pyomo\core\expr\numvalue.py:545(__getstate__) 1523 0.001 0.000 0.001 0.000 {built-in method builtins.hasattr}

1条回答

网友

1楼 · 发布于 2024-10-01 17:26:28

最终找到了一个解决方案，将函数参数的pickle转储到一个文件中，然后将文件名作为worker（）函数的参数传递，然后在每个并行进程中从函数内部打开每个文件

转储时间从~24秒降至~0.005秒

def worker(pickled_file_name, queue, shared_incumbent): 

    with open(pickled_file_name, "rb") as f:
        data_tuple = pickle.load(f, encoding='bytes')
    instance, data, optsolver, int_var_list, process_name, relaxed_incumbent = data_tuple
    return

def foo():
    [...]
    picklefile = open("pickled_vars"+str(i_nodo)+str(j_nodo)+".p", "wb") 
    picklefile.write(pickle.dumps(variables_,-1))
    picklefile.close()
                
    process_dict[process_name] = multiprocessing.Process(target=bnbparallelbranching, args=("pickled_vars"+str(i_nodo)+str(j_nodo)+".p", q, shared_incumbent_data))
    process_dict[process_name].start()

相关问题更多 >

编程相关推荐

热门问题

热门文章