擅长:python、mysql、java
<p>提出了这个带有pandas的hacky regex分隔符,它适用于给定的示例。我不建议这样做,也不建议使用正则表达式实际修复csv。不管怎样,给你:</p>
<pre><code>pd.read_csv('sample.csv', sep=r'"?(?<!\s)\|(?!\s)"?', engine='python', header=None)
</code></pre>
<p>仍然存在可能断裂的区域,例如管道附近没有任何空间。还有一个实际的分离器管道,其前后都有空间。主要问题是您的csv有未替换的引号导致这些问题</p>