Python:raw_unicode_escape不为“é”写入原始值

2024-10-04 05:34:24 发布

您现在位置:Python中文网/ 问答频道 /正文

有一个可爱的脚本,它用原始unicode打印出一堆文本来处理所有不同的语言。在

这个脚本在ascii字符和非拉丁语言(印地语、中文等)中工作良好

但是它无法打印出诸如“锓è”等字符的原始值。。。在

而不是在文件中的print“é”中打印原始unicode值\u00E9,而该文件又在网页上显示菱形询问标记。在

f = codecs.open(newFilePathAndName(path,filename,language),encoding='raw_unicode_escape', mode='w')
...
f.write(outputString)

当我在脚本中执行“打印”操作时,它会显示字符as\xe9

有什么想法吗?在

唯一让我想到的是将\xe替换为\u00的regex


Tags: 文件path标记脚本语言网页asciiunicode
1条回答
网友
1楼 · 发布于 2024-10-04 05:34:24

raw_unicode_escape编码确实没有为0xFF以下的值提供转义;这些值通常不会在原始python unicode文本中进行转义。在

请改用unicode_escape编码:

>>> print u'\u00e9'.encode('unicode_escape')
\xe9

相关问题 更多 >