Python imaplib.search电子邮件主题中文g

import imaplib,email host = 'imap.263.net' user = '***@***' psw = '*****' count = 0 con = imaplib.IMAP4(host,143) con.login(user,psw) con.select('INBOX',readonly =True) eva = '日报' # eva = eva.encode('utf-8') resp,liujf = con.search('UTF-8','SUBJECT','%s'%eva, 'Since','01-Feb-2018') items = liujf[0].split() print(len(items)) print(items)

2条回答

网友

1楼 · 编辑于 2024-10-04 05:22:51

您传入的是一个原始的Unicode字符串，在该字符串中，您应该以UTF-8字节序列的形式传入该字符串。你甚至把它标为UTF-8！这意味着你可能想了解一下两者之间的差异。在

改变

'%s'%eva

到

^{pr2}$

要了解更多背景，可以阅读https://www.unicode.org/faq/utf_bom.html#UTF8和/或https://nedbatchelder.com/text/unipain.html

构造'%s'%string只是说string的一种丑陋和不规则的方式，但这里实际上是一个错误：'%s'%string.encode('utf-8')生成一个字节字符串，然后将其插入到Unicode字符串中，这会产生完全错误的结果。注意：

>>> eva = '日报'
>>> eva.encode('utf-8')              # correct
b'\xe6\x97\xa5\xe6\x8a\xa5'
>>> '%s'%eva.encode('utf-8')         # incorrect
"b'\\xe6\\x97\\xa5\\xe6\\x8a\\xa5'"
>>> b'%s'%eva.encode('utf-8')        # correct but terribly fugly
b'\xe6\x97\xa5\xe6\x8a\xa5'

请注意'%s'%eva.encode('utf-8')如何获取编码的字节字符串并将其转换为Unicode表示。注释掉的行显示您尝试了eva = eva.encode('utf-8')，但是由于在Unicode字符串中不必要的%插值，结果显然是错误的。在

网友

2楼 · 编辑于 2024-10-04 05:22:51

我认为你应该先解码然后再编码中文文字。如果我们把它解释为拉丁语1编码，然后你先解码，再编码。不包括-伊娃。解码（'latin-1'）。编码（'utf-8'）

相关问题更多 >

编程相关推荐

热门问题

热门文章