读取cp819编码的文件

2024-10-02 10:30:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个用CP819编码的文件(从www上的某个地方下载的),想读取它,然后用UTF-8进一步处理数据。我试了所有我能找到的例子,但都没用。在

我能做的最远的事情是:

with codecs.open(INFIL, mode='rb',encoding='cp819') as INPUT:
 DUMMY=INPUT.readline()
 print (DUMMY)

这给了我

^{pr2}$

在输入文件的偏移量5处是ascii 128以上的第一个字符:\xe8应该解码为“è”。在

找到了一些关于这个错误信息的页面,尝试了我发现的所有建议,没有任何帮助。在

在Ubuntu 14.04.1 LTS上使用Python2.7.6


Tags: 文件数据编码inputwww地方withopen
1条回答
网友
1楼 · 发布于 2024-10-02 10:30:13

可以使用^{}显式编码unicode字符串:

with codecs.open(INFIL, encoding='cp819') as f:
    line = line.readline()
    print line.encode('utf-8')

另一种方法是使用环境PYTHONIOENCODING=utf-8集调用python程序。在

^{pr2}$

相关问题 更多 >

    热门问题