擅长:python、mysql、java
<p>数据采用非标准格式,因此任何解决方案都需要在完整数据集上进行测试。一种可能的解决方法是首先用<code>;"</code>替换<code>,"</code>字符,然后简单地在<code>;</code>上拆分它。这可以在不使用CSV或RE的情况下完成:</p>
<pre><code>tests = [
'"a,b"-"c,d","a,b"-"c,d"',
'"3-Amino-1,2,4-triazole"-text-0-"3-Amino-1,2,4-triazole"-CD-0,"3-Amino-1,2,4-triazole"-text-0-"3-Amino-1,2,4-triazole"-LS-0',
]
for test in tests:
row = test.replace(',"' , ';"').split(';')
print(len(row), row)
</code></pre>
<p>给予:</p>
<pre><code>2 ['"a,b"-"c,d"', '"a,b"-"c,d"']
2 ['"3-Amino-1,2,4-triazole"-text-0-"3-Amino-1,2,4-triazole"-CD-0', '"3-Amino-1,2,4-triazole"-text-0-"3-Amino-1,2,4-triazole"-LS-0'
</code></pre>