在多索引数据帧中，基于帐户级别0的一个特定列删除重复值

df = {'Modality': {('0020413', '1', '6/21/2017', 'DTI'): 1, ('0020413', '1', '6/21/2017', 'FLAIR'): 1, ('0020413', '1', '6/21/2017', 'T1'): 1, ('0020413', '3', '8/27/2019', 'DTI'): 1, ('0020413', '3', '8/27/2019', 'FLAIR'): 1, ('0020413', '3', '8/27/2019', 'T1'): 1, ('0021261', '1', '3/15/2017', 'DTI'): 1, ('0021261', '1', '3/15/2017', 'FLAIR'): 1, ('0021261', '1', '3/15/2017', 'T1'): 1, ('0021261', '2', '4/24/2018', 'DTI'): 1, ('0021261', '2', '4/24/2018', 'FLAIR'): 1, ('0021261', '2', '4/24/2018', 'T1'): 1, ('0021261', '3', '5/01/2019', 'DTI'): 1, ('0021261', '3', '5/01/2019', 'FLAIR'): 1, ('0021261', '3', '5/01/2019', 'T1'): 1}, 'Phase': {('0020413', '1', '6/21/2017', 'DTI'): 1, ('0020413', '1', '6/21/2017', 'FLAIR'): 1, ('0020413', '1', '6/21/2017', 'T1'): 1, ('0020413', '3', '8/27/2019', 'DTI'): 1, ('0020413', '3', '8/27/2019', 'FLAIR'): 1, ('0020413', '3', '8/27/2019', 'T1'): 1, ('0021261', '1', '3/15/2017', 'DTI'): 1, ('0021261', '1', '3/15/2017', 'FLAIR'): 1, ('0021261', '1', '3/15/2017', 'T1'): 1, ('0021261', '2', '4/24/2018', 'DTI'): 1, ('0021261', '2', '4/24/2018', 'FLAIR'): 1, ('0021261', '2', '4/24/2018', 'T1'): 1, ('0021261', '3', '5/01/2019', 'DTI'): 1, ('0021261', '3', '5/01/2019', 'FLAIR'): 1, ('0021261', '3', '5/01/2019', 'T1'): 1}}

1条回答

网友

1楼 · 发布于 2024-09-26 18:07:14

IIUC

尝试：

df=df.reset_index()

out=df[df['level_3'].isin(['DTI', 'FLAIR', 'T1'])]

out=out.drop_duplicates(['level_0','level_1','level_2','level_3']).set_index(['level_0','level_1','level_2','level_3'])

out.index.names=[None,None,None,None]

现在，如果您打印out，您将获得预期的输出

相关问题更多 >

编程相关推荐

热门问题

热门文章