如何将项目ID转换为列以执行Apriori算法TM Python?

2024-09-07 12:36:44 发布

您现在位置:Python中文网/ 问答频道 /正文

我有大量的销售订单。 我想在此数据集中查找频繁项集。 我真的不知道怎样才能做到。 在每个网页上,甚至在youtube上,它都只有一个例子!! 我使用groupby找到了不同的users,它们的item_id如下所示

df = pd.read_csv('orders.csv')
df2 = df.groupby(['ID_Customer','ID_Item']).sum()
print(df2.head())

结果是:

                     ID_Order  Amount_Gross_Order  Quantity_item
ID_Customer ID_Item                                             
466132   
        42545     1739614          29598889.0            1.0
        75068     6633327            119266.0            1.0
        80046     4909041             15000.0            1.0
        81692     2282609             68807.0            2.0

我想将每个item_id设置为一列,将01指定为apriori的可执行模式。 我尝试了一些解决方案,但通常都失败了。 我怎样才能真正运行apriori