我正在用file.readline()读取一个在Python中包含罗马尼亚语单词的文件。
因为编码,我有很多字符的问题。
示例:
>>> a = "aberație" #type 'str'
>>> a -> 'abera\xc8\x9bie'
>>> print sys.stdin.encoding
UTF-8
我试过用utf-8、cp500等编码,但没用。
我找不到我必须使用的正确字符编码?
提前谢谢。
编辑:目的是将文件中的单词存储在一个词典中,并且在打印时获得aberație而不是'abera\xc8\x9bie'
Tags:
你想干什么?
这是一组字节:
它是一组字节,表示字符串“aberație”的
utf-8
编码。对字节进行解码以获得unicode字符串:如果要将unicode字符串存储到文件中,则必须将其编码为您选择的特定字节格式:
相关问题 更多 >
编程相关推荐