Python 2.7 - 无法正确解码电子邮件主题头行 - 问答

Python 2.7 - 无法正确解码电子邮件主题头行

2024-09-28 03:19:35 发布

男 | 程序猿一只，喜欢编程写python代码。

我使用的是python2.7，我试图正确地解码电子邮件的主题标题行。邮件来源：

Subject: =?UTF-8?B?VGkgw6ggcGlhY2l1dGEgbGEgZGVtbz8gU2NvcHJpIGFsdHJlIG4=?=

我使用函数decode_header（header）从电子邮件标题库，结果是：

^{pr2}$

“xc3\xa8”部分应与“è”字符匹配，但未正确解码/显示。另一个例子：

Subject: =?iso-8859-1?Q?niccol=F2_cop?= =?iso-8859-1?Q?ernico?=

结果：

[('niccol\xf2 copernico', 'iso-8859-1')]

我怎样才能得到正确的字符串？在

Tags：函数标题主题电子邮件来源邮件 iso 解码

1条回答

网友

1楼 · 发布于 2024-09-28 03:19:35

你得到了正确的字符串。它只是经过编码的（第一种情况下使用UTF-8，第二种情况下使用iso-8895-1）；您需要对其进行解码以获得实际的unicode字符串。在

例如：

>>> print unicode('Ti \xc3\xa8 piaciuta la demo? Scopri altre n', 'utf-8')
Ti è piaciuta la demo? Scopri altre n

或者：

^{pr2}$

这就是为什么要同时返回头数据和编码。在