高效地生成Apriori频繁项集

2024-09-28 18:59:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图使用Apriori原理高效地生成频繁项集。我目前的尝试是使用itertool的组合,但它生成了不必要数量的项集。在生成它们时,我需要遵循先验原理

If an itemset is infrequent, then all its supersets must also be infrequent.

我目前的尝试效率很低

import itertools as it
def generateItemsets(Lk,k):

    comb = sum(Lk.keys(), tuple())
    Ck = set(it.combinations(comb, k))
    return Ck

Tags: an数量ifisitck原理comb
1条回答
网友
1楼 · 发布于 2024-09-28 18:59:36
<>你可以考虑fpGuest/FPMAX,用户指南可能对你有帮助。 供参考:http://rasbt.github.io/mlxtend/user_guide/frequent_patterns/fpmax/

此外,可能会有成吨的单行商品,例如:便利店你可能只需要买一瓶可乐或一杯咖啡。您可以考虑添加行总数和使用行总数gt;1,这将筛选出大量无关紧要的数据

相关问题 更多 >