我有一个非常大的数据帧,看起来像这样:
A B
SPH2008 3/21/2008 1 2
3/21/2008 1 2
3/21/2008 1 2
SPM2008 6/21/2008 1 2
6/21/2008 1 2
6/21/2008 1 2
我有以下代码,用于将两个索引的唯一对展平并获取为新的DF:
indeces = [df.index.get_level_values(0), df.index.get_level_values(1)]
tmp = pd.DataFrame(data=indeces).T.drop_duplicates()
tmp.columns = ['ID', 'ExpirationDate']
tmp.sort_values('ExpirationDate', inplace=True)
但是,此操作需要相当长的时间。有没有更有效的方法
IIUC,您还可以
groupby
多索引的级别,然后使用所需列从该级别创建数据帧:pandas.DataFrame.index.drop_duplicates
使用不能以这种方式解包的较旧版本的Python
相关问题 更多 >
编程相关推荐