使用Python，在返回匹配超过某个阈值的键（作为冻结集）时，比较两个大字典的最快方法是什么？

setOfMatches = set() for bigDictAkey, bigDictAval in bigDictA.items(): for bigDictBkey, bigDictBval in bigDictB.items(): itemsInCommon = list(frozenset.intersection(bigDictAkey,bigDictBkey)) numberOfItemsInCommon = len(itemsInCommon) valForComparison = THRESHOLD*float(len(list(bigDictAkey))) if (numberOfItemsInCommon >= valForComparison): setOfMatches.add(bigDictAkey)

1条回答

网友

1楼 · 发布于 2024-09-26 22:12:44

您没有使用bigDictA和bigDictB的值，因此不需要使用dict.items()方法。你知道吗
len()也适用于集合，因此无需将集合转换为列表以获得其大小。你知道吗
一旦有一个匹配项高于阈值，并且您将bigDictAkey添加到setOfMatches，就不需要测试bigDictB中的其余项，您应该立即break内部循环以检查bigDictA中的下一项。你知道吗

改进后的代码如下：

setOfMatches = set()
for bigDictAkey in bigDictA:
    for bigDictBkey in bigDictB:
        numberOfItemsInCommon = len(bigDictAkey & bigDictBkey)
        valForComparison = THRESHOLD*len(bigDictAkey)
        if (numberOfItemsInCommon >= valForComparison):
            setOfMatches.add(bigDictAkey)
            break

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用Python，在返回匹配超过某个阈值的键（作为冻结集）时，比较两个大字典的最快方法是什么？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >