Python，任何替代内存dict的方法都可以减少key=>值访问的内存

2条回答

网友

1楼 · 编辑于 2024-10-03 23:23:13

您有几种选择：

字典在3.6版本中有了很大的进步。速度更快，占用空间更小，默认订购，我肯定忘了什么。在

很明显，你在一台不符合要求的机器上做了一些受内存限制的事情。买更多的RAM，或者租一个m4.XLargeAWS实例，或者其他什么。在

您是否需要同时在内存中存储所有百万个项目？你是不是一下子就把它们都处理好了？几乎肯定不是。编写更聪明的算法，一次处理数据块，甚至一次处理项目。如果您使这个并发（not necessarily parallel），大多数等待时间将是IO，并且可以很容易地在Python中进行线程化。在

尝试使用生成器表达式和生成器。它们的内存使用量很小。在

数据库是专门用来解决这个问题的。编写一个小的导入程序将数据放入MySQL或MongoDB中，然后用SQL表达您的问题。在

网友

2楼 · 编辑于 2024-10-03 23:23:13

模块^{}提供了一个持久化字典，可以满足您的需要：

>>> import shelve
>>> db = shelve('cache.db')
>>> db = shelve.open('cache.db')
>>> db['id1'] = u'string data'
>>> db['id1']
'string data'

您可以像普通字典一样使用它，但它将所有数据存储在一个文件（数据库）的键值存储区中。这可能对您的需要足够快，因为后台正在进行一些缓存。尝试它的努力应该是相当小的。在