我有一个用CP819编码的文件(从www上的某个地方下载的),想读取它,然后用UTF-8进一步处理数据。我试了所有我能找到的例子,但都没用。在
我能做的最远的事情是:
with codecs.open(INFIL, mode='rb',encoding='cp819') as INPUT:
DUMMY=INPUT.readline()
print (DUMMY)
这给了我
^{pr2}$在输入文件的偏移量5处是ascii 128以上的第一个字符:\xe8应该解码为“è”。在
找到了一些关于这个错误信息的页面,尝试了我发现的所有建议,没有任何帮助。在
在Ubuntu 14.04.1 LTS上使用Python2.7.6
可以使用^{} 显式编码unicode字符串:
另一种方法是使用环境
^{pr2}$PYTHONIOENCODING=utf-8
集调用python程序。在相关问题 更多 >
编程相关推荐