多重处理中的类似错误。函数的参数数目不匹配

for dd in final_col_dates: idx1 = final_col_dates.tolist().index(dd) dataObj = GetPrevDataByDate(d1, a, dd, self.start_hour_of_day) data2 = dataObj.fit() dataObj = GetAppointmentControlsSchedule(data2, idx1, d, final_col_dates_mod, dd, self.DC, frgt_typ_filter) data3 = dataObj.fit() if idx1 > 0: data3['APPT_SCHD_ARVL_D_{}'.format(idx1)] = np.nan iter += 1 days_out_vars.append(data3)

Process SpawnPoolWorker-3: Traceback (most recent call last): File "C:\Users\dkanhar\Anaconda3\lib\multiprocessing\process.py", line 249, in _bootstrap self.run() File "C:\Users\dkanhar\Anaconda3\lib\multiprocessing\process.py", line 93, in run self._target(*self._args, **self._kwargs) File "C:\Users\dkanhar\Anaconda3\lib\multiprocessing\pool.py", line 108, in worker task = get() File "C:\Users\dkanhar\Anaconda3\lib\site-packages\sklearn\externals\joblib\pool.py", line 359, in get return recv() File "C:\Users\dkanhar\Anaconda3\lib\multiprocessing\connection.py", line 251, in recv return ForkingPickler.loads(buf.getbuffer()) TypeError: function takes at most 0 arguments (1 given)

for dd in final_col_dates: # multiprocessing.Pipe(False) p = multiprocessing.Process(target=self.ParallelLoopTest, args=(dd, final_col_dates, d1, a, d, final_col_dates_mod, iter, return_list)) jobs.append(p) p.start() for proc in jobs: proc.join()

File "<string>", line 1, in <module> File "C:\Users\dkanhar\Anaconda3\lib\multiprocessing\spawn.py", line 106, in spawn_main exitcode = _main(fd) File "C:\Users\dkanhar\Anaconda3\lib\multiprocessing\spawn.py", line 116, in _main self = pickle.load(from_parent) TypeError: function takes at most 0 arguments (1 given) Traceback (most recent call last): File "E:/Projects/Predictive Inbound Cartoon Estimation-MLO/Python/dataprep/DataPrep.py", line 457, in <module> print(obj.fit()) File "E:/Projects/Predictive Inbound Cartoon Estimation-MLO/Python/dataprep/DataPrep.py", line 39, in fit return self.__driver__() File "E:/Projects/Predictive Inbound Cartoon Estimation-MLO/Python/dataprep/DataPrep.py", line 52, in __driver__ final = self.process_() File "E:/Projects/Predictive Inbound Cartoon Estimation-MLO/Python/dataprep/DataPrep.py", line 135, in process_ sch_dat = self.inline_apply_(all_dates_schd, d1, d2, a) File "E:/Projects/Predictive Inbound Cartoon Estimation-MLO/Python/dataprep/DataPrep.py", line 297, in inline_apply_ p.start() File "C:\Users\dkanhar\Anaconda3\lib\multiprocessing\process.py", line 105, in start self._popen = self._Popen(self) File "C:\Users\dkanhar\Anaconda3\lib\multiprocessing\context.py", line 212, in _Popen return _default_context.get_context().Process._Popen(process_obj) File "C:\Users\dkanhar\Anaconda3\lib\multiprocessing\context.py", line 313, in _Popen return Popen(process_obj) File "C:\Users\dkanhar\Anaconda3\lib\multiprocessing\popen_spawn_win32.py", line 66, in __init__ reduction.dump(process_obj, to_child) File "C:\Users\dkanhar\Anaconda3\lib\multiprocessing\reduction.py", line 59, in dump ForkingPickler(file, protocol).dump(obj) BrokenPipeError: [Errno 32] Broken pipe

def ParallelLoopTest(self, dd, final_col_dates, d1, a, d, final_col_dates_mod, iter, days_out_vars): idx1 = final_col_dates.tolist().index(dd) dataObj = GetPrevDataByDate(d1, a, dd, self.start_hour_of_day) data2 = dataObj.fit() dataObj = GetAppointmentControlsSchedule(data2, idx1, d, final_col_dates_mod, dd, self.DC, frgt_typ_filter) data3 = dataObj.fit() if idx1 > 0: data3['APPT_SCHD_ARVL_D_{}'.format(idx1)] = np.nan print("Iter ", iter) iter += 1 days_out_vars.append(data3)

def ParallelLoopTest(dd, final_col_dates, d1, a, d, final_col_dates_mod, iter, days_out_vars, DC, start_hour): idx1 = final_col_dates.tolist().index(dd) dataObj = GetPrevDataByDate(d1, a, dd, start_hour_of_day) data2 = dataObj.fit() dataObj = GetAppointmentControlsSchedule(data2, idx1, d, final_col_dates_mod, dd, DC, frgt_typ_filter) data3 = dataObj.fit() if idx1 > 0: data3['APPT_SCHD_ARVL_D_{}'.format(idx1)] = np.nan print("Iter ", iter) iter += 1 days_out_vars.append(data3)

1条回答

网友

1楼 · 发布于 2024-09-22 20:28:21

实际上，在这两种情况下都会出现完全相同的错误，但在一个示例（joblib）中使用Process时，在主线程中不会得到相同的失败/回溯，因为它们没有以相同的方式管理进程失败。
在这两种情况下，您的进程似乎都无法取消对新的Process中的子作业的拾取。Pool返回取消拾取错误，而使用Process，则会出现错误，因为当子进程因该取消拾取错误而死亡时，它会关闭主线程用于写入数据的管道，从而导致主进程中出现错误。在

我的第一个想法是，错误是由于您尝试pickle一个实例方法而导致的，而您应该在这里尝试使用静态方法（使用实例方法似乎不正确，因为对象没有在进程之间共享）。
在声明ParallelLoopTest之前使用装饰符@staticmethod，并删除{}参数。在

编辑：另一种可能是其中一个参数dd, final_col_dates, d1, a, d, final_col_dates_mod, iter, return_list无法取消拾取。显然，它来自panda.DataFrame。
我看不出在这种情况下取消拾取失败的任何原因，但我不太清楚panda。
一种解决方法是将数据转储到临时文件中。您可以查看此链接here，以获得panda.DataFrame的有效序列化。另一个解决方案是使用DataFrame.to_pickle方法和panda.read_pickle将其转储/检索到文件中。在

请注意，最好将joblib.Parallel与{}进行比较，而不是与{}进行比较。在

相关问题更多 >

编程相关推荐

热门问题

热门文章