我有大量的销售订单。
我想在此数据集中查找频繁项集。
我真的不知道怎样才能做到。
在每个网页上,甚至在youtube上,它都只有一个例子!!
我使用groupby
找到了不同的users
,它们的item_id
如下所示
df = pd.read_csv('orders.csv')
df2 = df.groupby(['ID_Customer','ID_Item']).sum()
print(df2.head())
结果是:
ID_Order Amount_Gross_Order Quantity_item
ID_Customer ID_Item
466132
42545 1739614 29598889.0 1.0
75068 6633327 119266.0 1.0
80046 4909041 15000.0 1.0
81692 2282609 68807.0 2.0
我想将每个item_id
设置为一列,将0
或1
指定为apriori的可执行模式。
我尝试了一些解决方案,但通常都失败了。
我怎样才能真正运行apriori
目前没有回答
相关问题 更多 >
编程相关推荐