在文本文件中(测试.txt),我的字符串如下所示:
Gro\u00DFbritannien
在阅读它时,python会避开反斜杠:
^{pr2}$如何将其解释为unicode?decode()
和unicode()
不能完成这项工作。在
下面的代码将Gro\u00DFbritannien
写回文件,但我希望它是Großbritannien
>>> input.decode('latin-1')
u'Gro\\u00DFbritannien'
>>> out = codecs.open('out.txt', 'w', 'utf-8')
>>> out.write(input)
要使用
unicode_escape
编解码器:请参见the docs,了解作为Python标准库一部分的大量标准编码。在
使用内置的“unicode_escape”编解码器:
您还可以使用
^{2}$codecs.open()
:标准编码列表可在Python文档中找到:http://docs.python.org/library/codecs.html#standard-encodings
相关问题 更多 >
编程相关推荐