我有两个表/数据框:用户和活动
在用户中,我有以下列:用户ID,国家,DOB,性别,注册日期,周后注册日期
其中:
UserId:每个用户的Id(在此表中仅显示一次),此数据帧/表中每个用户Id只有一行-->;它也是链接两个表/数据帧的关键列
出生日期:出生日期
RegDate:用户的注册日期
WeekAfterRegDate:注册后7天之后的日期
在活动中我有以下列:用户ID,日期,收入
其中:
UserId:与用户中的列相同,但由于收入不同,它可以出现在多行中
我需要计算第一周每个用户产生的平均收入
我得到了这些线索,这些线索可能很有用:
总之,我需要做的是为每个用户id创建一个循环,在两个日期之间求和Renevue。这两个日期之间的时间间隔是RegDate和WeekAfterRegDate
我一直在尝试不同的方法,比如groupby等,但我有点迷路了
下面是我要做的: 首先,列出第一个数据帧中的用户
然后遍历此列表和第二个数据库,如下所示:
然后,只需将总收入除以总用户数即可
确保您的日期列实际上是datetime,因为您将无法比较字符串以便在第一周内仅筛选出这些实例。有关converting strings into datetime,请参见此处
合并两个表:
您将获得包含每行中各自日期的活动表
筛选合并列表:
该表现在只包含相关行
现在按用户分组并计算收入:
相关问题 更多 >
编程相关推荐