我使用的是python2.7,我试图正确地解码电子邮件的主题标题行。邮件来源:
Subject: =?UTF-8?B?VGkgw6ggcGlhY2l1dGEgbGEgZGVtbz8gU2NvcHJpIGFsdHJlIG4=?=
我使用函数decode_header(header)从电子邮件标题库,结果是:
^{pr2}$“xc3\xa8”部分应与“è”字符匹配,但未正确解码/显示。 另一个例子:
Subject: =?iso-8859-1?Q?niccol=F2_cop?= =?iso-8859-1?Q?ernico?=
结果:
[('niccol\xf2 copernico', 'iso-8859-1')]
我怎样才能得到正确的字符串?在
你得到了正确的字符串。它只是经过编码的(第一种情况下使用UTF-8,第二种情况下使用iso-8895-1);您需要对其进行解码以获得实际的unicode字符串。在
例如:
或者:
^{pr2}$这就是为什么要同时返回头数据和编码。在
相关问题 更多 >
编程相关推荐