酸洗非常大的文本文件,12Gb

2024-10-05 10:00:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我尝试使用以下代码来pickle一个大的文本文件:

import pickle

file1=open('/home/mustafa/data/wiki.en.text','r')
obj=[file1.read()]
pickle.dump(obj,open('data.pkl','w'),2)

我得到以下错误:

struct.error: 'i' format requires -2147483648 <= number <= 2147483647

我认为这可能是一个多处理问题。在


Tags: 代码textimportobjhomereaddatawiki
1条回答
网友
1楼 · 发布于 2024-10-05 10:00:03

对于这种序列化,pickle不是一个好的选择。即使是对cPickle来说,超过4Gb的信息也会带来很大的问题。您是否考虑过使用其他替代品,如SQLite或HDF5?在

相关问题 更多 >

    热门问题