擅长:python、mysql、java
<p>您可以使用<code>np.memmap</code>加载它,这将需要大约70MB:</p>
<pre><code>import numpy as np
with open('train.tsv') as f:
mm = np.memmap('test.memmap', shape=(7395, 27), dtype='|S4000', mode='w+')
f.next()
for i, l in enumerate(f):
mm[i,:] = l.strip().replace('"','').split('\t')
</code></pre>
<p>使用<code>del m</code>删除<code>m</code>或关闭Python控制台时,将保存该文件。在创建文件之后,可能需要将模式更改为<code>r+</code>。在</p>
<p>您可以像使用普通数组一样使用memmap数组,这将只允许您获取感兴趣的部分。在</p>