重塑非常大的数据框架

2024-07-08 14:36:24 发布

您现在位置:Python中文网/ 问答频道 /正文

我正试图将一个非常大的数据帧df1重塑为df2,但由于其大小,我得到了一个内存错误:

dict1 = [{'12/21/18': 0,'12/22/18': 0,'12/23/18': 1,'12/24/18': 1},
 {'12/21/18': 1,'12/22/18': 1,'12/23/18': 0,'12/24/18': 1},
 {'12/21/18': 0,'12/22/18': 1,'12/23/18': 0,'12/24/18': 0},
 {'12/21/18': 1,'12/22/18': 0,'12/23/18': 1,'12/24/18': 1}]
 df1 = pd.DataFrame(dict1, index= ['AAPL','CSCO','GE','MSFT' ])

 dict2 = [{'Ticker': 'AAPL','Date': '12/23/18'},
 {'Ticker': 'AAPL','Date': '12/24/18'},
 {'Ticker': 'CSCO','Date': '12/22/18'},
 {'Ticker': 'CSCO','Date': '12/24/18'},
 {'Ticker': 'GE',  'Date': '12/22/18'},
 {'Ticker': 'MSFT','Date': '12/24/18'}]
 df2 = pd.DataFrame(dict2) 

这就是我迄今为止所尝试的:

df1.index.name = 'Ticker' 
df2 = df1.reset_index().melt(id_vars='Ticker',var_name='Date') 

df2 = df2[df2.value == 1].set_index('Ticker').filter(['Date','Ticker']).sort_index()

但它只适用于小例子。有没有一种方法可以把它分成小块?你知道吗


Tags: namedataframedateindexpdtickerdf1df2

热门问题