读取文本fi时出现UnicodeDecodeError

3条回答

网友

1楼 · 编辑于 2024-09-27 22:44:17

如果你是一个Mac用户，很难弄清楚你的特定文件是用什么编码的。在

网友

2楼 · 编辑于 2024-09-27 22:44:17

除了在使用open时使用正确的Python方法指定编码之外，还可以尝试使用^{}工具来获取编码。在

文件foo.txt包含

ÙÚÛÜ

可以使用

^{pr2}$

正如使用^{}可以看到的，它包含九个字节，每个字符有两个字节，一个换行符。在

网友

3楼 · 编辑于 2024-09-27 22:44:17

不需要使用codecs.open()；这是python2的建议。在

在Python 3中，open()接受一个encoding参数：

fileObject = open("countable nouns raw.txt", "rt", encoding='utf8')

当然，这需要知道文件使用了什么编解码器。一般来说，Python不容易找到它；单独的文件格式可能包含编解码器信息，或者在给定的编解码器上进行了标准化，但是如果所有文件都有一个通用的文本文件，那么就必须弄清楚是什么创建了它，以及用什么编解码器来编写数据。在