擅长:python、mysql、java
<p>在pandas中,您需要设置参数,并且应该为csv列指定数据类型。
比如说</p>
<blockquote>
<p>low_memory= False</p>
</blockquote>
<pre><code>df = pd.read_csv("YOURFILENAME.csv", delimiter = '|',error_bad_lines=False,
index_col=False,
dtype='unicode') # , # This or the other one
#dtype={"user_id": int, "username": "string"}, low_memory = False)
</code></pre>
<p>最好的做法是为各个列指定数据类型,以防因为案例中有大量列而无法指定。您只需使用Try,第二列除外,并遍历值(如果string有string,如果int8有int 8,如果int64有相同的方式)</p>
<p>编辑:在读取excel时指定Unicode</p>