擅长:python、mysql、java
<p>不完全符合您提供的预期输出,问题中的更多详细信息会有所帮助,但无论如何:</p>
<pre><code>>>> txt = "Today it's 07.May 2011. Or 2.999."
>>> regexp_tokenize(txt, pattern=r"\w+([.',]\w+)*|[ \t]+")
['Today', ' ', "it's", ' \t', '07.May', ' ', '2011', ' ', 'Or', ' ', '2.999']
</code></pre>