<p>我制作了一个脚本,将一个长文件分割成多个小文件。当正好有4个整数时,它总是分裂。我想通过声明正好有4个整数来改进它,但只在行首。你知道吗</p>
<p>样本输入</p>
<pre><code>1020
200123242151111231 bla bla bla
200123331231231441 bla bla bla
1030
200123242151111231 bla bla bla
200123331231231441 bla bla bla
</code></pre>
<p>希望输出的是上述内容分为:</p>
<pre><code>200123242151111231 bla bla bla
200123331231231441 bla bla bla
</code></pre>
<p>以及</p>
<pre><code>200123242151111231 bla bla bla
200123331231231441 bla bla bla
</code></pre>
<p>当bla的其中一个值是4个整数时,它会添加一个额外的分割。如何确保重新拆分函数只检查一行的前4或5个值。你知道吗</p>
<pre><code>import re
file = open('testnew.txt', 'r')
i=0
for x in re.split(r"\b[0-9]{4}\s+", file.read()):
f = open('%d.txt' %i,'w')
f.write(x)
f.close()
print (x,i)
i = i+1
</code></pre>