Python中文
首页
教程
问答
标签
搜索
登录
注册
奇怪的Python集和散列行为是如何工作的?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个名为<code>GraphEdge</code>的类,我希望在一个集(内置的<code>set</code>类型)中通过其<code>tail</code>和{<cd4>}成员进行唯一定义,这两个成员通过<code>__init__</code>设置。在</p> <p>如果不定义<code>__hash__</code>,则会看到以下行为:</p> <pre><code>>>> E = GraphEdge('A', 'B') >>> H = GraphEdge('A', 'B') >>> hash(E) 139731804758160 >>> hash(H) 139731804760784 >>> S = set() >>> S.add(E) >>> S.add(H) >>> S set([('A', 'B'), ('A', 'B')]) </code></pre> <p>集合无法知道<code>E</code>和{<cd8>}在我的定义中是相同的,因为它们有不同的散列(据我所知,这是集合类型用来确定唯一性的方法),所以它将两者作为不同的元素添加。因此,我为<code>GraphEdge</code>定义了一个相当幼稚的哈希函数,如下所示:</p> ^{pr2}$ <p>现在,上述工作如预期:</p> <pre><code>>>> E = GraphEdge('A', 'B') >>> H = GraphEdge('A', 'B') >>> hash(E) 409150083 >>> hash(H) 409150083 >>> S = set() >>> S.add(E) >>> S.add(H) >>> S set([('A', 'B')]) </code></pre> <p>但是很明显,在本例中,<code>('A', 'B')</code>和{<cd11>}将返回相同的哈希值,因此我无法将<code>('B', 'A')</code>添加到已经包含<code>('A', 'B')</code>的集合中。但事实并非如此:</p> <pre><code>>>> E = GraphEdge('A', 'B') >>> H = GraphEdge('B', 'A') >>> hash(E) 409150083 >>> hash(H) 409150083 >>> S = set() >>> S.add(E) >>> S.add(H) >>> S set([('A', 'B'), ('B', 'A')]) </code></pre> <p>那么set类型是否使用哈希?如果是这样,最后一种情况如何可能?如果不是,为什么第一个场景(没有<code>__hash__</code>定义)不起作用?我错过什么了吗?在</p> <p><strong>编辑:</strong>为了供将来的读者参考,我已经定义了<code>__eq__</code>(也基于<code>tail</code>和<code>head</code>)。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>你有一个哈希冲突。在哈希冲突中,集合使用==运算符检查它们是否真正相等。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么在使用strptime时会出现未进行转换的数据错误?
10 回答
为什么在使用strptim时会出现这个datetime日期错误
1 回答
为什么在使用StyleFrame时索引列的标题不显示sf.至excel()?
9 回答
为什么在使用sum()函数时会发生“int”对象不可调用的错误?
1 回答
为什么在使用sympy.dsolve时会得到“'list'对象没有属性'func'”?
7 回答
为什么在使用tabla时会得到一个空的数据帧?
9 回答
为什么在使用tensorboard时需要add_graph()的第二个参数?
4 回答
为什么在使用TensorFlow Lite转换YOLOv4时,推断时间/大小没有改进?有什么可能的改进吗?
1 回答
为什么在使用Tensorflow加载训练批时会出现内存泄漏?
10 回答
为什么在使用tensorflow时会收到警告/错误(使用函数API,但未实现错误)
3 回答
为什么在使用tetpyclient发出POST请求时出现403错误?
8 回答
为什么在使用TextBlob时会出现HTTP错误?
4 回答
为什么在使用TFIDF时出现错误“IndexError:list index out of range”pyspark.ml.feature?
2 回答
为什么在使用timedelta格式化之后,我在python中的日期是错误的?
6 回答
为什么在使用timeit或exec函数时,函数中的变量不会在提供的全局命名空间中搜索?
6 回答
为什么在使用tkinter时不能使用复选框?
4 回答
为什么在使用todoistpythonapi时会返回这个奇怪的ID?
9 回答
为什么在使用TQM时,在调整图像大小时,处理时间会有很大的差异?
6 回答
为什么在使用Tweepy下载用户时间线时收到错误消息
3 回答
为什么在使用twitter帐户登录Django应用程序时重定向127.0.0.1:8000?
4 回答