Python:raw_unicode_escape不为“é”写入原始值

2024-10-04 05:34:24 发布

男 | 程序猿一只，喜欢编程写python代码。

有一个可爱的脚本，它用原始unicode打印出一堆文本来处理所有不同的语言。在

这个脚本在ascii字符和非拉丁语言（印地语、中文等）中工作良好

但是它无法打印出诸如“é”“è”等字符的原始值。。。在

而不是在文件中的print“é”中打印原始unicode值\u00E9，而该文件又在网页上显示菱形询问标记。在

f = codecs.open(newFilePathAndName(path,filename,language),encoding='raw_unicode_escape', mode='w')
...
f.write(outputString)

当我在脚本中执行“打印”操作时，它会显示字符as\xe9

有什么想法吗？在

唯一让我想到的是将\xe替换为\u00的regex

Tags：文件 path 标记脚本语言网页 ascii unicode

1条回答

网友

1楼 · 发布于 2024-10-04 05:34:24

raw_unicode_escape编码确实没有为0xFF以下的值提供转义；这些值通常不会在原始python unicode文本中进行转义。在

请改用unicode_escape编码：

>>> print u'\u00e9'.encode('unicode_escape')
\xe9