擅长:python、mysql、java
<p>分两个步骤:首先使用</p>
<pre><code>split -l 112 ../bigfile.csv
</code></pre>
<p>现在有了名为<code>xaa</code>、<code>xab</code>等的文件,我假设这些是目录中唯一的文件。现在可以循环它们,提取Id并重命名它们:</p>
^{pr2}$
<p><code>grep -o</code>只提取匹配项,并使用零宽度的“look-behind”来获取Id行。仅当使用Perl regex引擎(<code>-P</code>)时,才可以使用环顾。<code>-m 1</code>在第一个匹配之后停止,这样当您知道第一个匹配足够好时,就不会遍历整个文件。在</p>
<p><sub>当每个块没有112行时,这当然会严重中断,因为<a href="https://stackoverflow.com/a/34844677/3266847">proper solution</a>会解析文件。</sub></p>