在python中将unicode字符转换为utf8

2条回答

网友
1楼 · 编辑于 2024-10-02 20:34:52

可以将encode与反斜杠替换标志一起使用，如下所示：
>>> character.encode('ascii', 'backslashreplace') b'\\u0905 \\u0905 \\u0918 \\ua5c4'
如果您希望它是大写的，您可以随时添加.upper（）。在

网友
2楼 · 编辑于 2024-10-02 20:34:52

只需对unicode字符串调用encode()，然后调用^{}。在
s = u'\u0905 \u0905 \u0918 \ua5c4' print s अ अ घ ꗄ s_utf8 = s.encode('utf8') print s_utf8 अ अ घ ꗄ >>> s_utf8 '\xe0\xa4\x85 \xe0\xa4\x85 \xe0\xa4\x98 \xea\x97\x84' >>> from binascii import hexlify >>> hexlify(s_utf8) >>> 'e0a48520e0a48520e0a49820ea9784'
如果要保留空间，可以执行以下操作：
^{pr2}$
或者一次性：
>>> s u'\u0905 \u0905 \u0918 \ua5c4' >>> ' '.join(hexlify(c.encode('utf8')) for c in s.split()) 'e0a485 e0a485 e0a498 ea9784' >>> b' '.join(hexlify(c.encode('utf8')) for c in s.split()) # Python 3 b'e0a485 e0a485 e0a498 ea9784'
您可以对结果字符串调用upper()，以生成'E0A485 E0A485 E0A498 EA9784'：

相关问题更多 >

编程相关推荐

热门问题

热门文章