擅长:python、mysql、java
<p>如果需要提取用非字母分隔的单词,可以使用<code>\b[a-zA-Z]+\b</code>regex(输出<code>Originator</code>和{<cd3>}from{<cd4>})。在</p>
<p>如果你想限制那些最有可能是单词的实体,我建议如下:</p>
<p><code>(?<![.-])\b([a-z]{2,}|[A-Z]{1}[a-z]+|[A-Z]{2,})\b(?!\.|@|\-)</code></p>
<p>见<a href="https://regex101.com/r/lO8oV8/1" rel="nofollow">here</a>。此正则表达式将限制匹配的数量。在</p>