擅长:python、mysql、java
<p>您是否尝试过使用<code>cPickle</code>直接使用以下命令来pickle字典:</p>
<pre><code>import cPickle
DD = dict()
f = open('testfile.pkl','wb')
cPickle.dump(DD,f,-1)
f.close()
</code></pre>
<p>或者,如果需要的话,我可以使用hdf5或netcdf将向量保存在一个大的多维数组中,因为这允许您打开一个大数组,而无需一次将其全部放入内存,然后根据需要获取切片。然后,您可以将单词作为netcdf4/hdf5文件中的一个附加组进行关联,并使用通用索引从每个组中快速关联相应的片段,或者只将该组命名为单词,然后将数据作为向量。你得玩玩哪个更有效。在</p>
<p><a href="http://netcdf4-python.googlecode.com/svn/trunk/docs/netCDF4-module.html" rel="nofollow">http://netcdf4-python.googlecode.com/svn/trunk/docs/netCDF4-module.html</a></p>
<p>Pytables也可能是HDF5之上的一个有用的存储层:</p>
<p><a href="http://www.pytables.org" rel="nofollow">http://www.pytables.org</a></p>