无法在Python 2.4中解码unicode字符串

网友

1楼 · 编辑于 2024-09-28 20:49:16

您的字符串不是UTF8编码的。如果要将字符串“解码”为unicode，则字符串必须使用参数指定的编码。我试过了，效果很好：

print 'w\xf6rner'.decode('cp1250')

编辑

要将unicode字符串写入文件，可以使用编解码器模块：

import codecs
f = codecs.open("yourfile.txt", "w", "utf8")
f.write( ... )

指定输入/输出的编码和在整个代码中使用“unicode”字符串是很方便的，而无需考虑不同的编码。

网友

2楼 · 编辑于 2024-09-28 20:49:16

So in my code to reproduce I changed '\xf6' to '\xc3\xb6', and the failure still occurs

不在第一行它不：

>>> 'w\xc3\xb6rner'.decode('utf-8')
u'w\xf6rner'

第二行将出错，尽管：

>>> file.write('Name: %s - %s\n' %(Name, type(Name)))
UnicodeEncodeError: 'ascii' codec can't encode character u'\xf6' in position 7: ordinal not in range(128)

这完全是您所期望的，尝试将非ASCII Unicode字符写入字节流。如果使用Jiri建议的编解码器包装流，则可以直接编写Unicode，否则必须手动将Unicode字符串重新编码为字节。

更好的做法是，出于日志记录的目的，只需输出变量的repr（）。那么您就不必担心Unicode字符、换行符或其他不需要的字符：

name= 'w\xc3\xb6rner'.decode('utf-8')
file.write('Name: %r\n' % name)

Name: u'w\xf6rner'

网友

3楼 · 编辑于 2024-09-28 20:49:16

显然是1字节编码“在UTF-8中是”\xc3\xb6“。

编码可能是：

ISO-8859-1标准
ISO-8859-2标准
ISO-8859-13标准
ISO-8859-15标准
温-1250
温-1252

相关问题更多 >

编程相关推荐

热门问题

热门文章

无法在Python 2.4中解码unicode字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >