我有一个包含unicode字符串“aBiyukÙwa”、“varcasÙva”等的文本文件。当我尝试在python解释器中使用以下代码对它们进行解码时,它工作正常并解码为u'aBiyuk\xd9wa'
:
"aBiyukÙwa".decode("utf-8")
但是当我在下面的代码中使用codecs
模块从python程序的文件中读取它时,它抛出一个UnicodeDecodeError
。在
以下是错误消息:
UnicodeDecodeError: 'utf8' codec can't decode byte 0xd9 in position 8: invalid continuation byte
你知道是什么导致了这种奇怪的行为吗?在
你的文件不是用UTF-8编码的。找出它的编码是什么,然后使用它。在
相关问题 更多 >
编程相关推荐