擅长:python、mysql、java
<p>我建议采用基于regex的解决方案:</p>
<pre><code>import re
def to_words(text):
return re.findall(r'\w+', text)
</code></pre>
<p>这将查找所有单词-字母字符组,忽略符号、分隔符和空格。在</p>
^{pr2}$
<p>请注意,如果循环使用单词,那么使用返回生成器对象的<code>re.finditer</code>可能更好,因为您不需要一次存储整个单词列表。在</p>