如何在python2.7中提取和编码文本文件的数据?

2024-09-29 17:18:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我知道有人问了很多问题,我试过一些方法,但我做不好:

我有这样一个文本文件:

From: VENCA <email@infoclientes.venca.es>
Subject: =?ISO-8859-1?Q?=BFMaxi,_midi_o_mini=3F_=A1No_pases_d?=
 =?ISO-8859-1?Q?e_largo_porque_esto_te_interesa!?=
Subject: =?UTF-8?Q?Lo_mejor_de_Gmail_est=C3=A9s_donde_est=C3=A9s?=
From: Equipo de Gmail <mail-noreply@google.com>
Subject: =?UTF-8?Q?Tres_consejos_para_sacarle_el_m=C3=A1ximo_partido_a_Gmai?=
From: Equipo de Gmail <mail-noreply@google.com>
Subject: =?UTF-8?Q?Organ=C3=ADzate_mejor_con_la_bandeja_de_entrada_de_Gmail?=
From: Equipo de Gmail <mail-noreply@google.com>
From: VENCA <email@infoclientes.venca.es>
Subject: =?UTF-8?Q?MARINA,_comprueba_que_tus_datos_se?=
 =?UTF-8?Q?an_correctos_y_=C2=A1bienvenid@_a_Venca!?=
Subject: =?UTF-8?Q?Nuevo_inicio_de_sesi=C3=B3n_en_Chrome_con_Windows?=
From: Google <no-reply@accounts.google.com> 
[...]

每对From/Subject或Subject/From都是我要提取的内容,格式如下:

From: VENCA <email@infoclientes.venca.es> - Subject: ¿Maxi, midi o mini? ¡No pases de largo porque esto te interesa!

[…]

因此,我必须提取每一对(记住,有些科目是2,3。。。行长度)给我想要的格式和编码的主题从utf-8,iso。。。任何能让他们理解的东西

非常感谢!你知道吗


Tags: fromcomesemailgoogledemailgmail
1条回答
网友
1楼 · 发布于 2024-09-29 17:18:22
with open('infile.txt') as infile:
    try:
        while True:
            line1 = next(infile).rstrip()
            line2 = next(infile).rstrip()

            if line2.startswith('From:'):
                line1, line2 = line2, line1

            print line1, '-', line2

    except StopIteration:
        pass

相关问题 更多 >

    热门问题