在尝试读取文本文件时，是什么导致Unicode DecodeError？

def load_rightprob(self, rightprob_file): ''' dictionary with # people keys with # actions ''' rightProb = {} for line in open(rightprob_file): items = line.strip().split("\t") if len(items) != len(self.action_qid_dict) + 1: continue pid = int(items[0])

1条回答

网友

1楼 · 发布于 2024-10-03 21:34:18

文本文件以0xff开头是非常罕见的。因此，它有时被故意放在文件的开头，作为Unicode Byte Order Mark (BOM)的一部分，特别是在Windows上。正如您在链接中的表中所看到的，只有两种Unicode编码的BOM表以0xff开头：UTF-16或UTF-32，都是小端。在这两种情况中，UTF-16更为常见

因此，请按如下方式打开您的文件：

with open(rightprob_file, 'r', encoding='utf_16_le') as f:
    for line in f:

我添加了with以便在完成时自动关闭该文件，这是原始代码中的一个bug

从文件中读取的第一个字符将是u'\ufeff'，可以丢弃或忽略

编程相关推荐

Java中的第10个解决方案
Java中泛型的super和extends组合
Java Android OpenGL ES 2.0片段着色器texture2D不工作
在JList elementJava上按下时打开弹出窗口
字典Java数据结构允许对象上的布尔标志和排序？
java我该如何停止为AWS关系数据库服务收费？
java如何检查Google定位准确度是否提高？
java使用Mockito将方法存根在与被测类相同的类中（CUT）
java IntelliJIdea disable inspection：参数的实际值始终为
java CXF+多态POST数据

相关问题更多 >

编程相关推荐

热门问题

热门文章