我有一个充满股票交易的数据框。我想计算一下如何判断某个客户的订单是否比他们通常订购的少
注意:有些顾客可能会下一个大订单(是正常订单的两倍),然后再花两倍的时间来订购。或一半的大小和订单双倍的频率正常
数据布局:
SA\u DACCNT=账号 SA\u TRREF=发票编号
+-----------+------------+----------+------------+------------+
| SA_DACCNT | SA_TRDATE | SA_TRREF | SA_TRVALUE | SA_PRODUCT |
+-----------+------------+----------+------------+------------+
| GO63 | 01/05/2019 | 11587 | 0.98 | R613S/6 |
| GO63 | 01/05/2019 | 11587 | 0.98 | R614S/6 |
| AAA1 | 01/05/2019 | 11587 | 1.96 | R613S/18 |
| GO63 | 01/05/2019 | 11587 | 2.5 | POST3 |
| DOD2 | 01/07/2019 | 11588 | 7.84 | R613S/18 |
+-----------+------------+----------+------------+------------+
迄今为止:
我试着按客户分组,并将列重新取样到季度中,然后分析每个客户上一季度的z得分,但结果并不总是正确的,因为不是每个人都按季度订购。因此,有差距,扭曲的数字
我也厌倦了用线性模型拟合每个客户的数据,并用系数作为衡量消费是否下降的指标。但看起来还是不对
我一直在研究is,单调的,递增的和其他类似的函数,但是仍然找不到我要找的,我确信有一种统计方法可以解决这个问题,但是它对我很有用
我对这一切都很陌生,我一直在绞尽脑汁想如何最好地解决它
我的目标是确定谁(在过去的几次订单中)的花费比平时少
主要是我们需要给谁打电话/追逐/发送报价等
任何关于正确的分析方法的想法都会被采纳。我不想抄袭别人的代码,我相信我能自己解决
编辑:
我现在还尝试使用diff来计算订单之间的平均距离,并重新采样到这个值,然后计算Z分数。但这仍然不是我所期望的
目前没有回答
相关问题 更多 >
编程相关推荐