销售价值是否随着时间的推移而减少?Pandas

2024-06-16 10:26:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个充满股票交易的数据框。我想计算一下如何判断某个客户的订单是否比他们通常订购的少

注意:有些顾客可能会下一个大订单(是正常订单的两倍),然后再花两倍的时间来订购。或一半的大小和订单双倍的频率正常

数据布局:

SA\u DACCNT=账号 SA\u TRREF=发票编号

+-----------+------------+----------+------------+------------+
| SA_DACCNT | SA_TRDATE  | SA_TRREF | SA_TRVALUE | SA_PRODUCT |
+-----------+------------+----------+------------+------------+
| GO63      | 01/05/2019 | 11587    | 0.98       | R613S/6    |
| GO63      | 01/05/2019 | 11587    | 0.98       | R614S/6    |
| AAA1      | 01/05/2019 | 11587    | 1.96       | R613S/18   |
| GO63      | 01/05/2019 | 11587    | 2.5        | POST3      |
| DOD2      | 01/07/2019 | 11588    | 7.84       | R613S/18   |
+-----------+------------+----------+------------+------------+

迄今为止:

我试着按客户分组,并将列重新取样到季度中,然后分析每个客户上一季度的z得分,但结果并不总是正确的,因为不是每个人都按季度订购。因此,有差距,扭曲的数字

我也厌倦了用线性模型拟合每个客户的数据,并用系数作为衡量消费是否下降的指标。但看起来还是不对

我一直在研究is,单调的,递增的和其他类似的函数,但是仍然找不到我要找的,我确信有一种统计方法可以解决这个问题,但是它对我很有用

我对这一切都很陌生,我一直在绞尽脑汁想如何最好地解决它

我的目标是确定谁(在过去的几次订单中)的花费比平时少

主要是我们需要给谁打电话/追逐/发送报价等

任何关于正确的分析方法的想法都会被采纳。我不想抄袭别人的代码,我相信我能自己解决

编辑:

我现在还尝试使用diff来计算订单之间的平均距离,并重新采样到这个值,然后计算Z分数。但这仍然不是我所期望的


Tags: 数据订单客户时间sa发票布局频率