我有一个自行车数据集,在那里我有商店的专栏,它们在哪里出售,以及一些关于自行车型号的信息我需要比较每家商店的型号销售数字。因此,我需要执行以下操作:
按商店对自行车进行分组:
groups = df.groupby('store_id')
然后,对于该商店中的每个模型,我需要找到具有相似特征的模型。这是相似的高度、长度、重量等。为此,我设置了10%的差异界限,这意味着如果两个模型之间的重量差异小于10%,则另一个模型是可比较的邻居
最后,对于每一款车型,我想看看它在竞争对手中的排名,如果它的表现优于50%的竞争对手,那么它就会被贴上“畅销书”的标签
问题是,我不知道如何执行步骤2和步骤3。有人有主意吗?我已经在pandas文档中查看了Groupby.Transform,但我不知道它如何适合整个图片
非常感谢你的帮助
试试这个:
输出
请注意,在单元素社区中没有畅销书。调整规则以适合您的目的
我希望这有帮助
编辑
我添加了一个针对组的解决方案、定义邻里关系的多个规则和固定销售排名实施:
输出
我想有一种方法可以避免分组循环,但这似乎奏效了
相关问题 更多 >
编程相关推荐