使用2个不同的列删除其他dataframe中存在的行

importdf: System Email 1 Basic testimail@yahoo.com 2 Basic anotheremail@yahoo.com 3 Backend newemail@yahoo.com userdf: System Email 1 Basic testimail@yahoo.com 2 Backend anotheremail@yahoo.com 3 Basic newemail@yahoo.com

importdf_system = importdf['System'].tolist() importdf_emails = importdf['Email'].tolist() userdf_system = userdf['System'].tolist() userdf_emails = userdf['Email'].tolist() importdf.reset_index(drop=True) userdf.reset_index(drop=True) counter = len(importdf) for i in range(len(importdf)): counter = counter - 1 print(counter) for j in range(len(userdf)): if "@" in str(importdf_emails[i]) and "@" in str(userdf_emails[j]) and str(importdf_emails[i]).lower() == str(userdf_emails[j]).lower(): importdf = importdf.drop([i])

2条回答

网友

1楼 · 编辑于 2024-09-28 20:46:01

与新行保持一致

#Check column which is a concat of System and Email


 userdf['check']=userdf.System.str.cat(userdf.Email)
 importdf['check']=importdf.System.str.cat(importdf.Email)

#{}te

 res=userdf.assign(filter=np.where([x not in y for x, y in zip(userdf.check,importdf.check)],'drop','keep')).drop(columns=['check'])
print(res)

      System                Email    filter
1    Basic     testimail@yahoo.com   keep
2  Backend  anotheremail@yahoo.com   drop
3    Basic      newemail@yahoo.com   drop

网友

2楼 · 编辑于 2024-09-28 20:46:01

IIUC，您可以执行左合并并指定仅在左数据帧中的值

new_df = (
    pd.merge(df1, df2, on=["System", "Email"], how="left", indicator=True)
    .query('_merge == "left_only"')
    .drop("_merge", 1)
)


print(new_df)

    System                   Email
1    Basic  anotheremail@yahoo.com
2  Backend      newemail@yahoo.com

细节

pd.merge(df1,df2,on=['System','Email'],how='left',indicator=True)

    System                   Email     _merge
0    Basic     testimail@yahoo.com       both # < we will drop this.
1    Basic  anotheremail@yahoo.com  left_only
2  Backend      newemail@yahoo.com  left_only

细节

相关问题更多 >

编程相关推荐

热门问题

热门文章