有一个可爱的脚本,它用原始unicode打印出一堆文本来处理所有不同的语言。在
这个脚本在ascii字符和非拉丁语言(印地语、中文等)中工作良好
但是它无法打印出诸如“锓è”等字符的原始值。。。在
而不是在文件中的print“é”中打印原始unicode值\u00E9,而该文件又在网页上显示菱形询问标记。在
f = codecs.open(newFilePathAndName(path,filename,language),encoding='raw_unicode_escape', mode='w')
...
f.write(outputString)
当我在脚本中执行“打印”操作时,它会显示字符as\xe9
有什么想法吗?在
唯一让我想到的是将\xe替换为\u00的regex
raw_unicode_escape
编码确实没有为0xFF以下的值提供转义;这些值通常不会在原始python unicode文本中进行转义。在请改用
unicode_escape
编码:相关问题 更多 >
编程相关推荐