<p>使用<code>genfromtxt</code>加载此文件是直接的:</p>
<pre><code>In [280]: data=np.genfromtxt('stack42602390.csv',delimiter=',',names=True, dtype=None)
In [281]: data
Out[281]:
array([ ( 1, b'Wii Sports', b'Wii', 2006, b'Sports', b'Nintendo', 41.49, 29.02, 3.77, 8.46, 82.74),
( 2, b'Super Mario Bros.', b'NES', 1985, b'Platform', b'Nintendo', 29.08, 3.58, 6.81, 0.77, 40.24),
( 3, b'Mario Kart Wii', b'Wii', 2008, b'Racing', b'Nintendo', 15.85, 12.88, 3.79, 3.31, 35.82),
....
(11, b'Nintendogs', b'DS', 2005, b'Simulation', b'Nintendo', 9.07, 11. , 1.93, 2.75, 24.76)],
dtype=[('Rank', '<i4'), ('Name', 'S25'), ('Platform', 'S3'), ('Year', '<i4'), ('Genre', 'S12'), ('Publisher', 'S8'), ('NA_Sales', '<f8'), ('EU_Sales', '<f8'), ('JP_Sales', '<f8'), ('Other_Sales', '<f8'), ('Global_Sales', '<f8')])
</code></pre>
<p><code>b'string'</code>只是Python3显示bytestrings的方式,<code>genfromtxt</code>中的默认字符串格式。它们不会出现在Py2中。在</p>
<p>结果是一个结构化数组,具有不同的字段名和类型。它不是包含行和列的二维数组。在</p>
<p><code>NA_Sales</code>数据:</p>
^{pr2}$
<p>其中最大的:</p>
<pre><code>In [283]: np.argmax(data['NA_Sales'])
Out[283]: 0
</code></pre>
<p>以及相应的记录:</p>
<pre><code>In [284]: data[0]
Out[284]: (1, b'Wii Sports', b'Wii', 2006, b'Sports', b'Nintendo', 41.49, 29.02, 3.77, 8.46, 82.74)
</code></pre>
<p>为了充分利用这个数组,你必须阅读结构化数组。在</p>