Python pandas重采样占用太多内存

2024-10-02 08:24:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我有公司基本面数据的时间序列,如市值,按日期指数的收盘价,以及每周频率的cusip。我想重新采样,以获得每月一次的数据,但问题是我的代码占用了太多的内存和太多的时间来处理很少的数据。在

这是我的代码:

def getMonthlyData(start=(datetime.now()-relativedelta(years=5)),end=datetime.now()):
    _data=getWeeklyData(start,end)
    _startTime=datetime.now()
    _data=_data.unstack('Cusip').resample('M',how=(lambda x:x[-1])).stack('Cusip')
    _endTime=datetime.now()
    print("Time Taken to Resample Data : " + str(_endTime - _startTime))
    _data.sort_index(ascending=[False,True],inplace=True)
    return _data

getWeeklyData()函数很快返回数据(如果,比如说,我提取了大约两个月的数据),但在这之后,程序就有点挂起,内存消耗显著增加。在

我如何改进它?在


Tags: 数据内存代码truedatadatetime时间公司

热门问题