我有一个字符串(来自页面源),其中包含两封电子邮件:
<span class="inlinemeta">From: D Hui <dhui@tcmclinic.com>
Sent: Friday, June 18, 2010 12:57 PM
</span>
<span class="inlinemeta">To: 'pcox@medcoc.org'
Subject: New med approved?
我需要的是提取四个属性:SentFrom,SentTo,SentOn,Subject。你知道吗
在stackoverflow的帮助下,我可以得到SentOn,我现在被困在如何区分这两封电子邮件。 考虑到要解析的实际原始文本可能会有所不同,比如from可能包含前缀(在本例中是D Hui),也可能不包含前缀(比如第二封电子邮件),to也可能是这样,所以我真的需要在解决方案上有点灵活性。你知道吗
非常感谢你提前,我刚开始python一周前,所以请原谅我,如果问题太简单或太容易找到一个在线解决方案。你知道吗
同时,我一定会自己试试看是否能弄明白。你知道吗
这是一个更通用的解决方案,将文本分成几行。它还使用
split
和strip
来处理没有regex的日期和主题。你知道吗输出
email_regex
来自emailregex.com相关问题 更多 >
编程相关推荐