擅长:python、mysql、java
<p>调用<code>pandas.read_csv</code>时,可以使用与零个或多个空格后跟逗号、零个或多个空格匹配的正则表达式作为分隔符。</p>
<p>例如,这里有<code>"data.csv"</code>:</p>
<pre><code>In [19]: !cat data.csv
1.5, aaa, bbb , ddd , 10 , XXX
2.5, eee, fff , ggg, 20 , YYY
</code></pre>
<p>(第一行在<code>XXX</code>后以三个空格结束,而第二行在最后一个<code>Y</code>结束。)</p>
<p>下面使用<code>pandas.read_csv()</code>读取文件,使用正则表达式<code>' *, *'</code>作为分隔符。(使用正则表达式作为分隔符仅在<code>read_csv()</code>的“python”引擎中可用。)</p>
<pre><code>In [20]: import pandas as pd
In [21]: df = pd.read_csv('data.csv', header=None, delimiter=' *, *', engine='python')
In [22]: df
Out[22]:
0 1 2 3 4 5
0 1.5 aaa bbb ddd 10 XXX
1 2.5 eee fff ggg 20 YYY
</code></pre>