<p>最终解决方案-使用<a href="http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.replace.html" rel="nofollow noreferrer">^{<cd1>}</a>转换为<code>int</code>s,并使用<a href="http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.strip.html" rel="nofollow noreferrer">^{<cd4>}</a>从列名称中删除{<cd3>}:</p>
<pre><code>df = pd.read_csv('pulse.csv', quoting=3)
df = df.replace('"','', regex=True).astype(int)
df.columns = df.columns.str.strip('"')
print (df.head())
HEIGHT WEIGHT AGE GENDER SMOKES ALCOHOL EXERCISE TRT PULSE1 \
0 173 57 18 2 2 1 2 2 86
1 179 58 19 2 2 1 2 1 82
2 167 62 18 2 2 1 1 1 96
3 195 84 18 1 2 1 1 2 71
4 173 64 18 2 2 1 3 2 90
PULSE2 YEAR
0 88 93
1 150 93
2 176 93
3 73 93
4 88 93
</code></pre>
<p><code>index_col=False</code>表示强制不读取第一列到索引,但dataframe总是需要一些索引,因此添加了默认值-<code>0,1,2...</code>。所以这里可以省略。在</p>
<p><code>header=None</code>应该被删除,因为它强制不将第一行(csv的头)读取到<code>DataFrame</code>的列。然后,第一行数据也是标题,数值被转换成字符串。在</p>
<p><code>delimiter=','</code>也应该删除,因为它与<code>sep=','</code>什么是默认参数相同。在</p>