擅长:python、mysql、java
<p>首先把你的数据放到一个熊猫数据框里——我自己编的假数据——你需要弄清楚如何加载你的数据源。(来自csv或excel)。你知道吗</p>
<p>启动框架</p>
<pre><code>import pandas as pd
import datetime
df1 = pd.DataFrame({'Start_date' : ['2018-01-01','2018-01-02','2018-01-03','2018-02-
01','2018-03-10','2018-02-05'],'food' : [2, 2.5, 3, 2.4, 5, 4],'drinks' :
[1,2,3,4,5,6], 'wastage':[6,5,4,3,2,1]})
</code></pre>
<p>确保您的日期列上有日期格式-在这里,我的输入是字符串,所以我需要转换它(您需要在这里使用不同的格式)请参见(日期格式文档的底部:<a href="https://docs.python.org/2/library/datetime.html" rel="nofollow noreferrer">https://docs.python.org/2/library/datetime.html</a>)</p>
<pre><code> df1.Start_date = pd.to_datetime(df1.Start_date, format ='%Y-%m-%d')
</code></pre>
<p>我将添加一个月列:
编辑年份:</p>
<pre><code>df1["period"] = df1.Start_date.apply(lambda x: datetime.datetime.strftime(x, '%b-%y'))
df1['month'] = pd.DatetimeIndex(df1.Start_date).month
</code></pre>
<p>按平均值分组</p>
<pre><code> df1.groupby(['month']).mean() # for only month groupings
df1.groupby(['period']).mean() # for output listed above
</code></pre>