擅长:python、mysql、java
<p>使用拆分是一种方法,您可以使用正则表达式这样做:</p>
<pre><code>paragraphs = re.search('(.+?\n\n|.+?$)',TEXT,re.DOTALL)
</code></pre>
<p><code>.+?</code>是一个惰性匹配,它将匹配使整个正则表达式匹配的最短子字符串。否则,它将只匹配整个字符串</p>
<p>所以基本上这里我们想要找到一个字符序列(<code>.+?</code>),它以一个空行(<code>\n\n</code>)或字符串的结尾(<code>$</code>)结尾。
<code>re.DOTALL</code>标志使点也与换行符匹配(我们还希望匹配由三行组成的段落,其中没有空行)</p>