擅长:python、mysql、java
<p>正则表达式匹配空白字符和大写ASCII字母,但前提是它们前面有点、感叹号或问号。在</p>
<p>使用它拆分文本时,大写字母将成为用于拆分的分隔符的一部分,因此将被删除。在</p>
<p>将regex更改为</p>
<pre><code>(?<=[.!?])\s(?=[A-Z])
</code></pre>
<p>这封信不会成为比赛的一部分。在</p>
<p>不过,要注意两件事:</p>
<ol>
<li>只有当新句子以ASCII字母开头时,这才有效。对于大多数英语句子来说,你可能没问题,但对于其他语言来说肯定不行。在</li>
<li>如果文本包含缩写,可能会出现一些错误的拆分:<code>Mr. Smith</code>和{<cd2>}将被一分为二。在</li>
</ol>