擅长:python、mysql、java
<p>如果您不必使用迭代器,<a href="https://docs.python.org/2/library/re.html#re.split" rel="nofollow noreferrer">re.split</a>对于您的用例(句子的自定义定义)来说会更简单一些:</p>
<pre><code>re.split(r'\.\s', text)
</code></pre>
<p>注意,最后一句话将包括<code>.</code>或将为空(如果<code>text</code>在最后一个句点后以空格结尾),为了解决这个问题:</p>
^{pr2}$
<p>还要看一下<a href="https://stackoverflow.com/a/25736082/1176601">Python - RegEx for splitting text into sentences (sentence-tokenizing)</a>的答案中更一般的情况</p>
<p>对于一个完全通用的解决方案,您需要一个适当的<strong>句子标记器</strong>,例如<a href="http://www.nltk.org/api/nltk.tokenize.html" rel="nofollow noreferrer">^{<cd3>}</a></p>
<pre><code>nltk.tokenize.sent_tokenize(text)
</code></pre>