如何将groupby类别的索引分配给数据帧中的每个值?

2024-05-06 16:00:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我有数据帧(df): enter image description here

这里有user\u id、order\u completed\u at(订单日期)、cart(产品id)和reordered(以前是否订购过?)列。我想在df中再添加一列,其中包含特定用户的订单数量。例如,用户#2在2015-03-22 09:25:46下了他的第一个订单,这是他的第一个订单,因此我们在“购物车”项目旁边的新列中的每一行都放1。下次当用户_id=2下订单时(另一个日期,但用户_id=2),所有“购物车”项目都将被2索引,因为这是他从我们公司的第二个订单。我必须为所有用户和他们的订单做这件事。示例(已删除重新排序的列,此处不重要):

enter image description here

我尝试了一些groupby组合,结果并不理想,但可能会给你一些想法:

enter image description here

这里看起来任务完成了,但您可以注意到,user_id=3和cart=399被索引为2和3(我必须得到1,因为这只是第三个用户下的第一个订单)。在这个内核中,我得到了dataframe中每个购物车项目的外观

希望你们能有一些想法,伙计们


Tags: 数据项目用户订单iddf数量产品