在amazonses上,我有一个规则,可以将收到的电子邮件保存到S3存储桶中。Amazon以MIME格式保存这些文件。在
这些电子邮件的附件中有一个.txt
,它将在MIME文件中显示为content-type=text/plain
,Content-Disposition=attachment ... .txt
,和{
我可以使用python很好地解析它。在
当.txt
文件附件被压缩时(即content-type: applcation/zip
)解码时,我遇到了一个问题,好像编码不是base64
。在
我的代码:
import base64
s = unicode(base64.b64decode(attachment_content), "utf-8")
引发错误:
^{pr2}$下面是attachment_content
中“base64”字符串的前几行,顺便说一句,末尾的长度为53683+“=”,我认为base64的长度应该是4(?)的倍数。
所以也许解码失败是因为压缩正在改变attachment_content
,而我在解码之前/之后还需要一些其他的操作?我真的不知道。。在
UEsDBBQAAAAIAM9Ah0otgkpwx5oAADMTAgAJAAAAX2NoYXQudHh0tL3bjiRJkiX23sD+g0U3iOxu
REWGu8c1l2Ag8lKd0V2ZWajM3kLuC6Hubu5uFeZm3nYJL6+n4T4Ry8EOdwCSMyQXBRBLgMQ+7CP5
QPBj5gdYn0CRI6JqFxWv7hlyszursiJV1G6qonI5cmQyeT6dPp9cnCaT6Yvp5Yvz6xfJe7cp8P/k
1SbL8xfJu0OSvUvr2q3TOnFVWjxrknWZFeuk2VRlu978s19MRvNMrHneOv51SOZlGUtMLYnfp0nd
...
我也试过用“拉丁语-1”,但总是胡言乱语。在
问题是,在转换之后,我处理的是一个压缩文件,格式像“
PK \x03 \x04 \X3C \Xa \x0c ...
”,在将其转换为UTF-8unicode之前,我需要解压缩它。在这个代码对我有用:
相关问题 更多 >
编程相关推荐