熊猫 - 获得每个美国的每周平均值 - 问答

userid date secondsPlayed movesMade ++/acsbP2NFC2BvgG1BzySv5jko= 2016-04-28 413.88188 85 ++/acsbP2NFC2BvgG1BzySv5jko= 2016-05-01 82.67343 15 ++/acsbP2NFC2BvgG1BzySv5jko= 2016-05-05 236.73809 39 ++/acsbP2NFC2BvgG1BzySv5jko= 2016-05-10 112.69112 29 ++/acsbP2NFC2BvgG1BzySv5jko= 2016-05-11 211.42790 44 -----------------------------------CONT---------------------------------- ++/8ij1h8378h123123koF3oer1 2016-05-05 200.73809 11 ++/8ij1h8378h123123koF3oer1 2016-05-10 51.69112 14 ++/8ij1h8378h123123koF3oer1 2016-05-14 65.42790 53

df_grouped = df.groupby('userid').apply(lambda x: x.set_index('date').resample('1D').first().fillna(0)) df_result = df_grouped.groupby(level=0)['secondsPlayed'].apply(lambda x: x.rolling(min_periods=1, window=7).mean()).reset_index(name='secondsPlayed_week')

userid date secondsPlayed_w ++/acsbP2NFC2BvgG1BzySv5jko= 2016-04-28 4.138819e+02 ++/acsbP2NFC2BvgG1BzySv5jko= 2016-04-29 2.069409e+02 ++/acsbP2NFC2BvgG1BzySv5jko= 2016-04-30 1.379606e+02 ++/acsbP2NFC2BvgG1BzySv5jko= 2016-05-01 1.241388e+02 ++/acsbP2NFC2BvgG1BzySv5jko= 2016-05-02 9.931106e+01 ++/acsbP2NFC2BvgG1BzySv5jko= 2016-05-03 8.275922e+01 ++/acsbP2NFC2BvgG1BzySv5jko= 2016-05-04 7.093647e+01 ++/acsbP2NFC2BvgG1BzySv5jko= 2016-05-05 4.563022e+01

date userid secondsPlayed_w movesMade_w 2016-04-10 +1kexX0Yk2Su639WaRKARcwjq5g= 2.581356e+03 320 2016-04-17 +1kexX0Yk2Su639WaRKARcwjq5g= 4.040738e+03 615 2016-04-24 NaN 0.000000e+00 0 2016-05-01 ++RBPf9KdTK6pTN+lKZHDLCXg10= 1.644130e+05 17453 2016-05-08 ++DndI7do036eqYh9iW7vekAnx0= 3.775905e+05 31997 2016-05-15 ++NjKpr/vyxNCiYcmeFK9qSqD9o= 4.993430e+05 34706 2016-05-22 ++RBPf9KdTK6pTN+lKZHDLCXg10= 3.940408e+05 23779

2条回答

网友

1楼 · 编辑于 2024-10-01 22:25:57

更新

试试看

df1 = pd.DataFrame(index=pd.date_range('2015-04-24', periods = 50)).assign(value=1)
df2 = pd.DataFrame(index=pd.date_range('2015-04-28', periods = 50)).assign(value=1)

df3 = pd.concat([df1,df2], keys=['A','B'])

df3 = df3.rename_axis(['user','date']).reset_index()

df3.groupby('user').apply(lambda x: x.resample('7D', on='date').sum())

输出：

^{pr2}$

网友

2楼 · 编辑于 2024-10-01 22:25:57

您可以创建一个新的id帮助groupby

df.date=pd.to_datetime(df.date)
df['Newweeknumber']=df.groupby('userid').date.diff().dt.days.cumsum().fillna(0)//7# get the week number by the first date of each id
df.groupby(['userid','Newweeknumber']).agg({"userid":"first", "secondsPlayed":"sum", "movesMade":"sum"})

熊猫 - 获得每个美国的每周平均值

更新

相关问题更多 >

编程相关推荐

热门问题

热门文章

熊猫 - 获得每个美国的每周平均值

更新

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >