Python ASCII到Unicode

1条回答

网友

1楼 · 发布于 2024-09-27 01:30:19

您可以使用ord()为每个字符和格式获取整数代码点，而不是：

''.join(format(ord(c), '04x') for c in u_str)

演示：

^{pr2}$

或者您可以将其编码为UTF-16（big-endian）并对结果使用^{}；这可能是更快的选择：

^{3}$

演示：

>>> from binascii import hexlify
>>> hexlify(u_str.encode('utf-16-be'))
'003100324f60597d'

后者还处理BMP之外的字符，每个码位需要4个字节，这将使用UTF-16代理项对进行编码：

>>> hexlify(u'\U0001F493'.encode('utf-16-be'))
'd83ddc93'