擅长:python、mysql、java
<p>我发现这个<a href="http://www.cheatography.com/davechild/cheat-sheets/regular-expressions/" rel="nofollow">regex cheet sheet</a>对于这种情况非常有用。在</p>
<pre><code># -*- coding: utf-8
import re
import string
u = u"En.!?+ 123 g茅n茅ral un tr猫s bon hotel La terrasse du bar pr猫s du lobby"
p = re.compile(r"[^\w\s\d{}]".format(re.escape(string.punctuation)))
for m in p.finditer(u):
print m.group()
>>> 茅
>>> 茅
>>> 猫
>>> 猫
</code></pre>
<p>我也是<a href="https://pypi.python.org/pypi/Unidecode" rel="nofollow">^{<cd1>}</a>模块的超级粉丝。在</p>
^{pr2}$