擅长:python、mysql、java
<p>尽管这是一个最合适的regex工具,但它问的问题并不合适。您可以迭代变量中的每个字符使用<code>ord(c) > 0xFFFF</code>来检测有问题的字符。在</p>
<p>但是如果您需要regex,请尝试(python3)</p>
<pre><code>import re
r1 = re.compile("[\U00010000-\U0010FFFF]")
m1 = r1.search( "Text\u00A0\U0001FFFF" )
print (m1.group())
print (m1.start())
print (m1.end())
</code></pre>
<p>对于python2,只需在字符串文字之前添加“u”(使其成为unicode)。在</p>