多进程分割一个文件总是IO绑定的吗？

from multiprocessing import Pool def process_line(line): return "FOO: %s" % line if __name__ == "__main__": pool = Pool(4) with open('file.txt') as source_file: # chunk the work into batches of 4 lines at a time results = pool.map(process_line, source_file, 4)

1条回答

网友

1楼 · 发布于 2024-05-19 10:28:41

正如您所怀疑的那样，这是工作负载实际上不会从multiprocessing中获益（如果有的话）。你所要做的就是读取一个文件，然后将该文件的内容写入其他文件。这完全是I/O的限制；瓶颈是读写磁盘的速度。使用multiprocessing尝试同时将多个文件写入同一个磁盘不会使写入速度更快，因为磁盘一次只能写入一个内容。在

multiprocessing的帮助是，如果你有一些CPU限制的工作可以并行化，但这并不是你所要做的。如果您想从一个文件中读取行，对每一行进行一些相当繁重的处理，然后将它们写入另一个文件，multiprocessing可能会有所帮助，但在写入每一行之前似乎不需要进行任何处理。在

相关问题更多 >

编程相关推荐

热门问题

热门文章