我试图使用Apriori原理高效地生成频繁项集。我目前的尝试是使用itertool的组合,但它生成了不必要数量的项集。在生成它们时,我需要遵循先验原理
If an itemset is infrequent, then all its supersets must also be infrequent.
我目前的尝试效率很低
import itertools as it
def generateItemsets(Lk,k):
comb = sum(Lk.keys(), tuple())
Ck = set(it.combinations(comb, k))
return Ck
此外,可能会有成吨的单行商品,例如:便利店你可能只需要买一瓶可乐或一杯咖啡。您可以考虑添加行总数和使用行总数gt;1,这将筛选出大量无关紧要的数据
相关问题 更多 >
编程相关推荐