从两个数据流中提取唯一行

网友

1楼 · 编辑于 2024-10-03 23:24:15

例如，你可以。你知道吗

1）创建具有非重复项的遮罩（~反转选择）。感谢温对这个解决方案的评论，你的索引需要对齐。你知道吗

m = ~df1.isin(df2).all(1)
# Access dataframe with one of below
#df1[m]
#df2[m]
#pd.concat([df1,df2]).loc[m]

2）从连接的数据帧中删除重复项（故障保护，假设您的值是3个集）

df = pd.concat([df1,df2])
df.loc[~df.duplicated(keep=False)]

3）您可以将lambda函数作为2 passa的变体添加到loc。你知道吗

df = pd.concat([df1,df2]).loc[lambda x: ~x.duplicated(keep=False)]

网友

2楼 · 编辑于 2024-10-03 23:24:15

在创建tuple之后使用symmetric_difference

set(df1.apply(tuple,1)).symmetric_difference(set(df2.apply(tuple,1)))
Out[653]: {('b', 'h', 50), ('d', 'j', 10), ('d', 'm', 5), ('z', 'h', 40)}

或者只是

set(df1.apply(tuple,1))^set(df2.apply(tuple,1))
Out[654]: {('b', 'h', 50), ('d', 'j', 10), ('d', 'm', 5), ('z', 'h', 40)}

网友

3楼 · 编辑于 2024-10-03 23:24:15

这将根据它们合并的位置添加一列：

merged = df1.merge(df2, indicator=True, how='outer')
final = merged[merged['_merge'] != 'both']
print(final)

这将执行df1和df2的右外部合并，并添加一列，指示合并发生的位置，以及该行对于df是唯一的还是仅存在于一个或另一个行中：

>>> merged[merged['_merge'] != 'both']
  C1 C2  Value      _merge
1  b  h     50   left_only
3  d  j     10   left_only
4  z  h     40  right_only
5  d  m      5  right_only

相关问题更多 >

编程相关推荐

热门问题

热门文章

从两个数据流中提取唯一行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >