python中的快速64位确定性哈希

2024-09-28 15:30:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我以前一直在使用adler32来生成一个32位的文本块散列(然后我将其用作文件名,用于保存该文本的已处理版本的缓存)。e、 g

  hashed_file_name = adler32(pragraph.encode())

我希望增加散列大小,以减少冲突的可能性[例如,两个不同的文本块得到相同的哈希代码,假设我有大约1000万个文本块,我认为在大约0.2%的情况下会发生冲突-即1000万/2^32]

我的问题是,什么是产生至少64位哈希的最快哈希生成器?sha1是否是一个高效的选项[产生160位散列]?i、 e

^{pr2}$

虽然这对我的neads来说是一个过度的杀戮,但就处理时间而言,其他版本/选项是否更有效?在


Tags: 代码name文本版本文件名选项情况可能性