如何编写一个函数,根据列中的值创建数据帧的子集?

2024-09-24 22:29:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我构建了一个数据框架,其中包括为期两年的每日美元预订。在数据框中,索引是预订日期,还有一列是预订季度(例如2018年第2季度)。我还设置了一个按季度累计的总和,这样我就可以查询任何日期并查看该季度在该时间点的总预订量

我的最终目标是按季度获得累计预订量的平均曲线,但我在理解如何将数据框子集到季度时遇到了一些问题,以便可以对每个子集应用曲线函数。我希望通过显式列出四分之一的值来避免子集设置,因为它们在未来的数据集中会有所不同

newbusiness_raw = csv.reader('newbusinesstrend_raw')

nb_raw = pandas.read_csv(
                         'newbusinesstrend_raw.csv',
                         index_col="Close Date",
                         parse_dates=True)

nb_cum = nb_raw.dropna(subset=['Amount'])
nb_cum = nb_cum.sort_index()
nb_cum['CumAmount'] = nb_cum.groupby('FQ')['Amount'].cumsum()

Tags: csv数据框架indexraw时间amount曲线