编码utf8并解码到iso885916

2024-06-26 14:43:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图理解从utf-8到其他编码的转换是如何工作的。在

在这个示例:-I有一个字符串,我用“utf-8”编码,用“iso-8859-16”解码。 只是想知道,在转换过程中如何添加额外的字节?在

>>> r_post='Hello Günter'
>>> r_post=r_post.encode('utf-8')
>>> r_post
b'Hello G\xc3\xbcnter'
>>> r_post=r_post.decode('iso-8859-16')
>>> r_post
'Hello GĂŒnter'

Tags: 字符串示例hello编码字节过程iso解码
1条回答
网友
1楼 · 发布于 2024-06-26 14:43:11
Hello G\xc3\xbcnter

这是一个字节串,其中两个字节用于'u'方便地突出显示。在UTF-8编码中,字符'u'由两个字节C3 BC表示。在

读取这些字节并用ISO-8859-16编码解释它们,就会得到“Hello GĂnter”字符。在8859-16中,字节C3表示字符“Ă”,而BC表示字符“Œ”。在

如果需要更深入的解释,请参阅What Every Programmer Absolutely, Positively Needs To Know About Encodings And Character Sets To Work With Text。在

相关问题 更多 >