比较2个数据帧列并删除行

df1 = pd.DataFrame({'Filename':['image1','image1','image2','image3'], 'Name':['Dog','Cat','Cat', 'Cat'], 'values':['2','3','4','5'] }) df2 = pd.DataFrame({'Filename':['image1','image2','image3'], 'Name':['Dog','Cat', 'Cat'], 'values':['5','6','7'] })

for i, j in df1.iterrows(): for m, n in df1.iterrows(): if m['Filename'] == i['Filename']: if m['LabelName'] == i['LabelName']: pass else: print('delete') df2=df2.drop(i) df1=df1.sort_values('Filename') df2=df2.sort_values('Filename') break

2条回答

网友

1楼 · 编辑于 2024-09-28 17:17:41

这是一个不太像python的解决方案，但它确实起到了作用：

l1=[(df1.Filename.iloc[i],df1.Name.iloc[i]) for i in range(len(df1))]
l2=[(df2.Filename.iloc[i],df2.Name.iloc[i]) for i in range(len(df2))]
lfin=[i for i in l1 if i in l2]
   
for i in df1.index:
    if (df1.Filename.loc[i], df1.Name.loc[i]) not in lfin:
        df1.drop(i, inplace=True)

for i in df2.index:
    if (df2.Filename.loc[i], df2.Name.loc[i]) not in lfin:
        df2.drop(i, inplace=True)

网友

2楼 · 编辑于 2024-09-28 17:17:41

嘿，我觉得这工作做得很好

df3 = df2.set_index('Filename')
df1[df1.apply(lambda x : df3.loc[x.Filename]['Name']== x.Name , axis =1 ) ]

如果您想丢失索引并重置它，可以添加

df3 = df2.set_index('Filename')
df1[df1.apply(lambda x : df3.loc[x.Filename]['Name']== x.Name , axis =1 )  ].reset_index().drop('index' , axis=1)

相关问题更多 >

编程相关推荐

热门问题

热门文章