我构建了一个数据框架,其中包括为期两年的每日美元预订。在数据框中,索引是预订日期,还有一列是预订季度(例如2018年第2季度)。我还设置了一个按季度累计的总和,这样我就可以查询任何日期并查看该季度在该时间点的总预订量
我的最终目标是按季度获得累计预订量的平均曲线,但我在理解如何将数据框子集到季度时遇到了一些问题,以便可以对每个子集应用曲线函数。我希望通过显式列出四分之一的值来避免子集设置,因为它们在未来的数据集中会有所不同
newbusiness_raw = csv.reader('newbusinesstrend_raw')
nb_raw = pandas.read_csv(
'newbusinesstrend_raw.csv',
index_col="Close Date",
parse_dates=True)
nb_cum = nb_raw.dropna(subset=['Amount'])
nb_cum = nb_cum.sort_index()
nb_cum['CumAmount'] = nb_cum.groupby('FQ')['Amount'].cumsum()
目前没有回答
相关问题 更多 >
编程相关推荐