Regex不在本地工作，尽管在每个在线Regex tes中工作

mail = imaplib.IMAP4_SSL('imap.gmail.com',993) mail.login('*************', '**************') # Out: list of "folders" aka labels in gmail. mail.select("inbox") # connect to inbox. typ, data = mail.search(None, 'SUBJECT', 'Zeiterfassung') worked_time_pattern = re.compile(r'"(?P<time>\d+(,\d)?)"[^>]*?selected[^>]*>=?(\r?\n?)(?P=time)<') # old version: worked_time_pattern = re.compile(r'\"(?P<time>[0-9]+(?:[,][0-9])?)\"(?: disabled)? selected(?: disabled)? style=3D"">[=]?[\n]?(?P=time)<\/option>') date_pattern = re.compile('.*Date: [a-zA-Z]{1,4}[,] (?P<date>[0-9]{1,2} [a-zA-Z]{1,4} [0-9]{4}).*', re.DOTALL) count = 0 countFail = 0 if 'OK' == typ: for num in data[0].split(): typ, data = mail.fetch(num, '(RFC822)') mailbody = "".join(data[0][1].split("=\r\n")) mailbody = "".join(mailbody.split("\r")) mailbody = "".join(mailbody.split("\n")) worked_time = worked_time_pattern.search(data[0][1]) date = date_pattern.match(data[0][1]) if worked_time != None: print worked_time.group('time') count = count + 1 else: print mailbody countFail = countFail + 1 print worked_time print "You worked on %s\n" % ( date.group('date')) #print 'Message %s\n%s\n' % (num, data[0][1]) print count print countFail mail.close() mail.logout()

1条回答

网友

1楼 · 发布于 2024-05-20 15:27:49

如果您认为它正在将=\r\n插入到数据中，那么继续删除它，同时还要删除所有\r和{}s

mailbody = "".join(data[0][1].split("=\r\n"))
mailbody = "".join(data[0][1].split("\r"))
mailbody = "".join(data[0][1].split("\n"))

然后尝试使用我在评论中建议的正则表达式-尽管您的原始表达式可能也可以正常工作。在

^{pr2}$

正如Quirliom在评论中指出的，这是一个很好的例子，说明了为什么不应该使用regex来解析HTML——尽管如果换行符出现在中间单词中，那么这也不是有效的HTML。在

相关问题更多 >

编程相关推荐

热门问题

热门文章