擅长:python、mysql、java
<p>您可能想看看<code>raw_unicode_escape</code>编码。在</p>
<pre><code>>>> len(b'\\uffff')
6
>>> b'\\uffff'.decode('raw_unicode_escape')
'\uffff'
>>> len(b'\\uffff'.decode('raw_unicode_escape'))
1
</code></pre>
<p>因此,函数是:</p>
^{pr2}$
<p>但是,这也匹配其他unicode转义序列,比如<code>\Uxxxxxxxx</code>。如果只想匹配<code>\uxxxx</code>,请使用regex,如下所示:</p>
<pre><code>import re
escape_sequence_re = re.compile(r'\\u[0-9a-fA-F]{4}')
def _escape_sequence_to_char(match):
return chr(int(match[0][2:], 16))
def ParseString2Unicode(sInString):
return re.sub(escape_sequence_re, _escape_sequence_to_char, sInString)
</code></pre>