擅长:python、mysql、java
<p>需要在输入中找到一致的模式(我假设在这个数据集中有很多具有不一致分隔符的字符串)可能使用正则表达式来执行拆分:<a href="https://docs.python.org/2/library/re.html" rel="nofollow">https://docs.python.org/2/library/re.html</a></p>
<p><a href="http://openrefine.org/" rel="nofollow">OpenRefine</a>如果字符串来自输入文件,则有助于数据清理。你知道吗</p>