加快写入文件的速度

fd = open(data_file, 'w') for c, (recordid, values) in enumerate(generatevalues()): row = prep_row(recordid, values) fd.write(row) if c % 117 == 0: if limit > 0 and c >= limit: break sys.stdout.write('\r%s @ %s' % (str(c + 1).rjust(7), datetime.now())) sys.stdout.flush()

rows = [] for c, (recordid, values) in enumerate(generatevalues()): rows.append(prep_row(recordid, values)) if c % 117 == 0: fd.write('\n'.join(rows)) rows = []

3条回答

网友

1楼 · 编辑于 2024-10-01 00:33:54

实际上，你的问题并不是file.write()占用你20%的时间。你80%的时间不在这里！

写入磁盘的速度很慢。你真的无能为力。把东西写到磁盘上只需要很长时间。你几乎没办法加快速度。

你想要的是让I/O时间成为程序的最大部分，这样你的速度就被硬盘的速度而不是你的处理时间所限制。理想情况是file.write()100%使用！

网友

2楼 · 编辑于 2024-10-01 00:33:54

您可以在python中执行mmap，这可能会有帮助。但我怀疑您在分析时犯了一些错误，因为20秒内7k*1500大约是0.5兆字节/秒。做一个测试，您可以用相同的长度编写随机行，您会发现它比这快得多。

网友

3楼 · 编辑于 2024-10-01 00:33:54

将写操作成批地分成500个组确实大大加快了写操作的速度。对于这个测试用例，写入行在I/O中分别花费了21.051秒，而成批写入117行则花费了5.685秒来写入相同数量的行。500批总共只花了0.266秒。

相关问题更多 >

编程相关推荐

热门问题

热门文章