如何在不删除NaN值的情况下删除pandas中的重复项

2024-09-17 18:26:29 发布

男 | 程序猿一只，喜欢编程写python代码。

我有一个查询的数据框，我只想从某个列中获取唯一的值。
我尝试执行以下代码：

    database = pd.read_csv(db_file, sep='\t')
    query = database.loc[database[db_specifications[0]].isin(elements)].drop_duplicates(subset=db_specification[1])

db_specification只是一个包含我查询的两列的列表。
有些值是{{CD2}}，我不想把它们看成是重复的，我怎么才能做到呢？

Tags： csv 数据代码 read db elements query database

1条回答

网友

1楼 · 发布于 2024-09-17 18:26:29

您可以从选择所有NaN开始，然后在数据帧的其余部分删除复制

mask = data.isna().any()
data = pd.concat([data[mask], data[~mask]])

编程相关推荐

两个整数的java模除
java是否可以在两个或多个不同的端口上运行相同的tomcat？
java组、收集器、映射（Int到字符串）、映射（映射到对象）
java Android材料设计与向后兼容性
运行不同工作目录的java Runnable
java“类是不可赋值的”是什么意思？
java在Windows JNI JNI_CreateJavaVM上加载多个JAR
对话框中的java微调器不显示项目？
一维数组中的java三角矩阵get（）
java在一组日期中查找时间空间

如何在不删除NaN值的情况下删除pandas中的重复项

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在不删除NaN值的情况下删除pandas中的重复项

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >