我正在写一个小脚本,允许我将我的Facebook联系人的电子邮件地址导入GMail/Android。我的输入文件包含unicode字符,例如:Jasmin L\u00f3pez。生成的CSV输出文件如下所示:
Andr\u00e9 Zzz,,,,,,,,,,,,,,,,,,,,,,,,,,fbcontacts ::: * My Contacts,* Home,zzz@yahoo.com
Andr\u00e9ia Ggg,,,,,,,,,,,,,,,,,,,,,,,,,,fbcontacts ::: * My Contacts,* Home,ggg@hotmail.com
Andr\u00e9s Bbb,,,,,,,,,,,,,,,,,,,,,,,,,,fbcontacts ::: * My Contacts,* Home,bbb@gmail.com
如你所见,我在编码方面有问题。我正在创建一个谷歌联系人CSV文件,但我需要正确显示姓名。我用这个函数来写CSV:
def writecsv(self):
if self.outfile is not '':
#fh = open(self.outfile, 'wb')
#fh = codecs.open(self.outfile, "wb", "utf-8")
fh = codecs.open(self.outfile, 'wb', encoding="latin-1")
else:
fh = sys.stdout
csvhdlr = csv.writer(fh, quotechar='"', quoting=csv.QUOTE_MINIMAL)
csvhdlr.writerow("Name,Given Name,Additional Name,Family Name,Yomi Name,Given Name Yomi,Additional Name Yomi,Family Name Yomi,Name Prefix,Name Suffix,Initials,Nickname,Short Name,Maiden Name,Birthday,Gender,Location,Billing Information,Directory Server,Mileage,Occupation,Hobby,Sensitivity,Priority,Subject,Notes,Group Membership,E-mail 1 - Type,E-mail 1 - Value".split(','))
for contact in self.clist:
#csvhdlr.writerow(dict((vname, vtype, vnotes, vstereotype, vauthor, valias, vgenfile.encode('utf-8')) for vname, vtype, vnotes, vstereotype, vauthor, valias, vgenfile in row.iteritems()))
row = contact.fullname + ',,,,,,,,,,,,,,,,,,,,,,,,,,fbcontacts ::: * My Contacts,* Home,' + contact.email
csvhdlr.writerow(row.split(','))
有什么想法吗?我对python还很陌生,每次我必须使用编码时,它都不能像我希望的那样工作
非常感谢你的帮助!在
如果我没弄错的话,您的文件不包含高unicode字符;它只包含unicode转义序列,如“\u00f3”,表示高unicode字符。如果您的文件实际上包含字符串“Jasmin L\u00f3pez”(带有一个字面反斜杠和u),那么您需要在写入之前将其解码为实际的unicode字符。看看
unicode_escape
编解码器。在相关问题 更多 >
编程相关推荐