如何在不删除NaN值的情况下删除pandas中的重复项

2024-09-17 18:26:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个查询的数据框,我只想从某个列中获取唯一的值。
我尝试执行以下代码:

    database = pd.read_csv(db_file, sep='\t')
    query = database.loc[database[db_specifications[0]].isin(elements)].drop_duplicates(subset=db_specification[1])

db_specification只是一个包含我查询的两列的列表。
有些值是{{CD2}},我不想把它们看成是重复的,我怎么才能做到呢?


Tags: csv数据代码readdbelementsquerydatabase
1条回答
网友
1楼 · 发布于 2024-09-17 18:26:29

您可以从选择所有NaN开始,然后在数据帧的其余部分删除复制

mask = data.isna().any()
data = pd.concat([data[mask], data[~mask]])

相关问题 更多 >