如何加载包含unicode字符字典的pickle文件？

网友

1楼 · 编辑于 2024-06-28 19:48:57

我认为问题在于codecs.open的使用。pickle是二进制文件而不是文本，codec用于从某些文本编码到unicode的透明转换。你应该改用open。

网友

2楼 · 编辑于 2024-06-28 19:48:57

pickle是一种二进制格式，在编写之前使用编解码器翻译会破坏它。尝试只写一个文件并将其加载回：

>>> mydict={'öö':1,'ää':2}
>>> mydict
{'\xc3\xb6\xc3\xb6': 1, '\xc3\xa4\xc3\xa4': 2}
>>> pickle.dump(mydict, open('/tmp/test.pkl', 'wb'))
>>> pickle.load(open('/tmp/test.pkl', 'rb'))
{'\xc3\xb6\xc3\xb6': 1, '\xc3\xa4\xc3\xa4': 2}

但最有可能的是，您首先要使用Unicode：

>>> mydict={u'öö':1,u'ää':2}

网友

3楼 · 编辑于 2024-06-28 19:48:57

老问题但是。。。我也遇到过同样的问题，我不认为额外的磁盘IO是一个好的解决方案。我建议您使用base64编码/解码。

import base64

serialized_str = base64.b64encode(pickle.dumps(mydict))
my_obj_back = pickle.loads(base64.b64decode(serialized_str))

即使是cPickle也可以用同样的方法来加快批量结果。

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何加载包含unicode字符字典的pickle文件？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >