从pythonunicode字符串获取UTF8字符代码

2条回答

网友

1楼 · 编辑于 2024-10-01 15:44:04

使用encode方法：

utf8_str.encode('utf8')

请注意，utf8_str不是这个变量的好名字。原始字节序列使用UTF-8编码来表示Unicode字符；对unicode的调用将它们“解码”成实际的Unicode码位。为了找回字节，只需将代码点重新编码为UTF-8。在

网友

2楼 · 编辑于 2024-10-01 15:44:04

如果要验证unicode字符串的内容，请使用^{} function：

>>> from binascii import unhexlify
>>> unhexlify(''.join('ec a7 80 ec 97 ad 2f ea b5 ad ea b0 80 0a'.split()))
'\xec\xa7\x80\xec\x97\xad/\xea\xb5\xad\xea\xb0\x80\n'
>>> print unhexlify(''.join('ec a7 80 ec 97 ad 2f ea b5 ad ea b0 80 0a'.split())).decode('utf8')
지역/국가

>>> print repr(unhexlify(''.join('ec a7 80 ec 97 ad 2f ea b5 ad ea b0 80 0a'.split())).decode('utf8'))
u'\uc9c0\uc5ed/\uad6d\uac00\n'

unicode值的repr()结果对非ASCII和非Latin1代码点使用\uhhhh转义序列；对于拉丁语1代码点和不可打印字符，使用\xhh转义序列。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

从pythonunicode字符串获取UTF8字符代码

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >