Python中文
首页
教程
问答
标签
搜索
登录
注册
Python中MD5和SHA2的碰撞
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在写一个简单的MP3编目器来记录我的各种设备上有哪些MP3。我计划使用MD5或SHA2键来识别匹配的文件,即使它们已被重命名/移动,等等。我不想匹配逻辑上等价的MP3(即:相同的歌曲,但编码不同)。我有大约8000个MP3,其中只有6700个生成了唯一的密钥。在</p> <p>我的问题是,不管我选择什么哈希算法,我都会遇到冲突。在一个例子中,我在同一张专辑中有两个碰巧是曲目1和2的文件,它们的文件大小不同,但无论我使用MD5、SHA2-256、SHA2-512等,它们都会产生相同的哈希键。。。在</p> <p>这是我第一次真正在文件上使用哈希键,这是一个意外的结果。从我对这些哈希算法所知甚少,我觉得这里有点可疑。这可能是MP3或Python实现的问题吗?在</p> <p>下面是我使用的代码片段:</p> <pre><code> data = open(path, 'r').read() m = hashlib.md5(data) m.update(data) md5String = m.hexdigest() </code></pre> <p>如果你能对为什么会发生这种情况给出任何答案或见解,我们将不胜感激。提前谢谢。在</p> <p><strong>--更新--</strong>:</p> <p>我尝试在linux(使用Python2.6)执行这段代码,但没有产生冲突。如stat调用所示,这些文件是不同的。我还下载了WinMD5,但这没有产生冲突(8d327ef3937437e0e5abpf6485c24bb3和9b2c66781cbe8c1be7d6a1447994430c)。这是Windows上Python hashlib的一个bug吗?我在Python2.7.1和2.6.6下尝试了相同的方法,结果都是一样的。在</p> ^{pr2}$
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>如果几个不同的哈希算法都返回相同的哈希结果,或者您的实现中存在错误,那么您遇到问题的文件几乎肯定是相同的。在</p> <p>作为一个健全的测试,编写您自己的“hash”,它只返回整个文件的内容,并查看这个是否生成相同的“hash”。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
尽管Python中的所有内容都是引用,为什么Python导师在没有指针的列表中绘制字符串和整数?
8 回答
尽管python中的表达式为false,但循环仍在运行
7 回答
尽管python代码正确,但从nifi ExecuteScript处理器获取语法错误
7 回答
尽管Python在Neovim中工作得很好,但插件不能识别Neovim中的Python主机
4 回答
尽管python字典包含了大量的条目,但它并没有增长
3 回答
尽管python说模块存在,为什么我会得到这个消息?
10 回答
尽管setuptools和控制盘是最新的,但无法识别singleversionexternallymanaged
7 回答
尽管stdout和stderr重定向,但未捕获错误消息
10 回答
尽管Tensorboard的事件太大,但Tensorboard的步骤太少了
5 回答
尽管tkinter上的变量已更改,但显示未更改
1 回答
尽管try/except使用Python进行单元测试时出现断言错误
2 回答
尽管URL是sam,但仍会抛出“达到最大重定向”
2 回答
尽管url有效,Pandas仍读取url的\u csv错误
2 回答
尽管while中存在时间延迟,但LINUX线程的CPU利用率为100%(1)
1 回答
尽管x0在范围内,Scipy优化仍会引发ValueError
6 回答
尽管xpath正确,但使用selenium单击链接仍不起作用
3 回答
尽管下载了ffmpeg并设置了路径变量python,但没有后端错误
3 回答
尽管下载了i,但找不到型号“fr”
5 回答
尽管下载了plotnine包,但未获取名为“plotnine”的模块时出错
10 回答
尽管为所有行指定了权重,网格(0)仍不起作用
3 回答