在Python3.4中使用多处理时出现断言错误

import numpy as np import multiprocessing as mp import os class TestClass(object): def __init__(self, data): super().__init__() self.data = data def top_level_function(self, nproc = 1): if nproc > os.cpu_count(): nproc = os.cpu_count() if nproc == 1: sums = [self._sub_function() for i in range(10)] elif 1 < nproc: print('multiprocessing engaged with {} cores'.format(nproc)) with mp.Pool(nproc) as p: sums = [p.apply_async(self._sub_function) for i in range(10)] sums = [pp.get() for pp in sums] self.sums = sums return sums def _sub_function(self): return self.data.sum(0) if __name__ == "__main__": t = TestClass(np.zeros((126,512,512))) ans = t.top_level_function() print(len(ans)) ans = t.top_level_function(4) print(len(ans)) t = TestClass(np.zeros((126,2048,2048))) ans = t.top_level_function() print(len(ans)) ans = t.top_level_function(4) print(len(ans))

1条回答

网友

1楼 · 发布于 2024-05-07 04:55:48

当你这么做的时候

sums = [p.apply_async(self._sub_function) for i in range(10)]

发生的情况是，self._sub_function将被pickle 10次并发送到一个worker进程进行处理。要pickle一个实例方法，必须对整个实例（包括data属性）进行pickle。快速检查显示，pickled时np.zeros((126,2048,2048))需要4227858596个字节，而您要发送10倍的字节到10个不同的进程。在

您在_send_bytes期间遇到一个错误，这意味着到工作进程的传输被中断，我猜是因为您达到了内存限制。在

您可能应该重新考虑您的设计，如果每个工作人员都可以处理部分问题而不需要访问整个数据，那么多处理通常是最有效的。在

相关问题更多 >

编程相关推荐

热门问题

热门文章