列（收入）的总值基于：数据中另一列（日期）的值和另一列（用户ID）的值

2条回答

网友
1楼 · 编辑于 2024-10-01 02:32:10

下面是我要做的：首先，列出第一个数据帧中的用户
user_list = first_df.UserId.unique().tolist()
然后遍历此列表和第二个数据库，如下所示：
revenue_total = 0 for i in range(len(user_list)): for x in range(len(second_df): if second_df['userid'][x] == user_list[i] and second_df['Date'][x] <= first_df['WeekAfterRegDate'][i]: revenue_total = revenue_total + second_df['Revenue'][x]
然后，只需将总收入除以总用户数即可
total_revenue /len(user_list)

网友
2楼 · 编辑于 2024-10-01 02:32:10

确保您的日期列实际上是datetime，因为您将无法比较字符串以便在第一周内仅筛选出这些实例。有关converting strings into datetime，请参见此处
合并两个表：
df_merged = pd.merge(activity,users,on='UserID')
您将获得包含每行中各自日期的活动表
筛选合并列表：
df_merged = df_merged.loc[df_merged['Date'] >= df_merged['RegDate']] # lower bound df_merged = df_merged.loc[df_merged['Date'] < df_merged['WeekAfterRegDate']] # upper bound
该表现在只包含相关行
现在按用户分组并计算收入：
df_revenue = df_merged.groupby('UserID')['Revenue'].sum()

相关问题更多 >

编程相关推荐

热门问题

热门文章