如何使用bytestring并在Python中恢复重音字符?

2024-10-01 09:25:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个来自电子邮件的字符串。我不确定字符串的原始编码,但是在电子邮件客户端中它显示如下:

'Somebody LastNáme'

我以为是utf-8编码。当我从utf-8解码时,。。。你知道吗

'Somebody LastNáme'.decode('utf-8')

。。。我在python shell中得到以下unicode字符串:

 u'Somebody LastN\xe1me' 

我还尝试了拉丁1编码,在unicode上浏览了文档,看到一个锐音编码为拉丁1。在解码时,它以相同的方式显示,即不能表示为ascii的字节显示为\xe1。你知道吗

我想知道1)当我查看终端中的非ascii字符串(而不是转义字符串)时,是否可以让python显示重音字符,以及2)当我随后使用字符串时,是否(或如何确保)在浏览器中正确呈现该字符串。你知道吗


Tags: 字符串文档客户端编码电子邮件asciiunicodeshell