如果另一列中的值为null，则删除重复项

2条回答

网友

1楼 · 编辑于 2024-09-27 07:27:56

这将过滤掉None和空值（如果存在任何非None或非空值），只保留Vehicle遇到的第一个值

import pandas as pd

df=pd.DataFrame({"Name": ["Dave", "Mark", "Steve", "Dave", "Steve"], "Vehicle": ["Car", "Bike", "Car", None, ""]})

res=df.sort_values("Vehicle", ascending=False).groupby("Name")["Vehicle"].first().reset_index()

输出：

    Name Vehicle
0   Dave     Car
1   Mark    Bike
2  Steve     Car

网友

2楼 · 编辑于 2024-09-27 07:27:56

我认为您需要具有位AND（&）和^{}和^{}的链2掩码：

m1 = df['Vehicle'].notna()
m2 = ~df['Name'].duplicated()

df1 = df[m1 & m2]
print (df1)
    Name Vehicle
0   Dave     Car
1   Mark    Bike
2  Steve     Car

如果要分别执行这些操作-首先删除所有nan行，然后删除重复项，以避免测试NaN行中的重复项（如果需要）：

df2 = df.dropna(subset=['Vehicle']).drop_duplicates('Name')
print (df2)
    Name Vehicle
0   Dave     Car
1   Mark    Bike
2  Steve     Car

相关问题更多 >

编程相关推荐

热门问题

热门文章

如果另一列中的值为null，则删除重复项

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >