擅长:python、mysql、java
<p>我觉得这样的事情应该对你有用。regex中可能有比需要的更多的内容,但是您的需求有些模糊,与您提供的预期输出不完全匹配。在</p>
<pre><code>>>> txt = "Today it's \t07.May 2011. Or 2.999."
>>> p = re.compile(r"\d+|[-'a-z]+|[ ]+|\s+|[.,]+|\S+", re.I)
>>> slice_starts = [m.start() for m in p.finditer(txt)] + [None]
>>> [txt[s:e] for s, e in zip(slice_starts, slice_starts[1:])]
['Today', ' ', "it's", ' ', '\t', '07', '.', 'May', ' ', '2011', '.', ' ', 'Or', ' ', '2', '.', '999', '.']
</code></pre>