是否有更简单的方法来捕获两个数据帧之间的数据差异。我试图比较2个数据帧并找到丢失的数据帧。我发现这个附加的链接,但它不满足我的要求。在那篇文章中,他们使用Id进行比较,但我想比较2个数据帧的整行,并找出不匹配的行,无论它是来自A还是B
Iterate over different dataframe
DF 1:
country from to flag
('GB', 'GB390065', 'GB66903', 'Y')
('FR', 'FR418458', 'FR765617', 'Y')
('FR', 'FR629810', 'FR855277', 'Y')
('FR', 'FR494010', 'FR332891', 'Y')
('FR', 'FR740500', 'FR907878', 'Y')
('FI', 'NB444135', 'NB234471', 'Y')
DF 2:
country from to flag
('GB', 'GB390065', 'GB66903', 'Y')
('FR', 'FR418458', 'FR7656', 'Y')
('FR', 'FR629810', 'FR855277', 'Y')
('FR', 'FR4910', 'FR33891', 'Y')
('FR', 'FR740500', 'FR907878', 'Y')
('FI', 'NB444135', 'NB234471', 'Y')
我的预期产出:
country from to flag Available
('FR', 'FR418458', 'FR7656', 'Y' df2)
('FR', 'FR4910', 'FR33891', 'Y' df2)
我在这里面临的挑战是from column
和to column
是相同的数据,只是当我尝试使用merge function
时,它获取列中的任何一个并给出不符合要求的结果
我得到的结果是
country_code from_cust_id ... to_cust_guid Merge_status
322443 DE DE180556 ... NaN left_only
322444 DE DE22191 ... NaN left_only
322445 DE DE2625168 ... NaN left_only
322446 DE DE17705 ... NaN left_only
322447 DE DE2556758 ... NaN left_only
[5 rows x 7 columns]
country_code from_cust_id ... to_cust_guid Merge_status
0 DE NaN ... DE485137 right_only
1 DE NaN ... DE467209 right_only
2 DE NaN ... DE651068 right_only
3 DE NaN ... DE459729 right_only
4 DE NaN ... DE448683 right_only
试一试
以下是将dataframe转换为一组元组的方法:
试试这个
相关问题 更多 >
编程相关推荐