为什么将python的shelve转换为dict会占用这么多内存？

1条回答

网友

1楼 · 发布于 2024-09-29 01:28:13

根据我的经验，我认为酸洗比你目前所做的更像是一个记忆狂。但是，创建一个dict会同时将工具架中的每个键和值加载到内存中，而且您不应该因为shelf在磁盘上有6GB而假定它在内存中只有6GB。例如：

>>> import sys, pickle
>>> sys.getsizeof(1)
24
>>> len(pickle.dumps(1))
4
>>> len(pickle.dumps(1, -1))
5

因此，一个非常小的整数是Python int对象（在我的机器上）的5-6倍。在

至于解决方法：您可以将多个pickle对象写入一个文件。因此，不要将shelf转换为dict，只需在文件中写入一个长序列的键和值，然后在另一端读取同样长的键和值序列以放入新的shelf中。这样，一次只需要在内存中有一个键/值对。像这样：

写下：

^{pr2}$

阅读：

with open('myshelf.pkl', 'rb') as infile:
    for _ in xrange(pickle.load(infile)):
        k, v = pickle.load(infile)
        myShelf[k] = v

我认为您实际上不需要存储长度，您可以继续读取，直到pickle.load抛出一个异常，表明它的文件已用完。在