回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我有一个excel.csv文件,看起来像这样</p>
<pre><code>id,ticker1,ticker2,Company,Supplier
9,MMM,DHR,3M Company,Danaher Corporation
10,MMM,IBM,3M Company,International Business Machines Corporation
11,MMM,UNP,3M Company,Union Pacific Corporation
12,MMM,TMO,3M Company,Thermo Fisher Scientific Inc.
13,MMM,NSC,3M Company,Norfolk Southern Corporation
61,No,0,,
14,MMM,TER,3M Company,"Teradyne, Inc."
</code></pre>
<p>这里的数据是逗号分隔的,所以我使用<code>delimiter=','</code>,但在某些情况下,就像在最后一行一样,文本中也有逗号。在我的csv文件中,所有带逗号的字符串都用引号<code>" "</code>。我已尝试使用open()读取该文件</p>
<blockquote>
<p><strong>with open('file.csv','r') as f:</strong> <br/>
for row in f.read().split('\n'):</p>
</blockquote>
<p>但这样我必须处理逗号和空值。所以我很好奇,哪一种是处理损坏的csv文件的正确方法?我应该像熊猫一样使用正则表达式还是LIB</p>