擅长:python、mysql、java
<p>Python内存不足,因为您要创建的对象太大了。原因是您的数据包含一些非常大的字符串(请注意,在您之前的问题中)。在</p>
<p>您创建的数组<code>data</code>只有一个<code>dtype</code>。此数据类型的大小被选择为足以容纳数据中最长的字符串。但不管其他内容如何,对于数据中的每个字段,分配的内存量是相同的!因此,数组内存中的大小可能会比数据文件的大小大得多!在</p>
<p>作为一种解决方案,您可以为每个列指定数据类型,但更简单的方法是只加载实际需要的数据:</p>
<pre><code>data = sp.genfromtxt('data/train.tsv',
delimiter ='\t',
names=True,
usecols='avglinksize','label'))
</code></pre>