提取电子邮件签名的方法

2024-06-13 22:01:24 发布

您现在位置:Python中文网/ 问答频道 /正文

我想从一个单列Pandas数据帧中提取电子邮件签名,其中每一行都包含一个作为字符串的离散电子邮件消息。有些电子邮件是HTML编码的,有些则不是。它们可以是任何电子邮件提供商(例如:Gmail、Microsoft、Yahoo等)。在

我知道Gmail签名包含在div中,其中class="email_signature"简化了对这些签名的解析。我的难题是:提取非gmail电子邮件签名的最佳方法是什么?有没有正则表达式可以捕获电子邮件的内容?如何在Python中的Pandas数据帧上应用此regex?在

我想举个例子,但是数据是私人的,坦白地说,我认为这个问题没有必要。在


Tags: 数据字符串div消息pandas编码电子邮件email