回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>是否有更简单的方法来捕获两个数据帧之间的数据差异。我试图比较2个数据帧并找到丢失的数据帧。我发现这个附加的链接,但它不满足我的要求。在那篇文章中,他们使用Id进行比较,但我想比较2个数据帧的整行,并找出不匹配的行,无论它是来自A还是B</p>
<p><a href="https://stackoverflow.com/questions/50959624/iterate-over-different-dataframe">Iterate over different dataframe</a></p>
<p>DF 1:</p>
<pre><code>country from to flag
('GB', 'GB390065', 'GB66903', 'Y')
('FR', 'FR418458', 'FR765617', 'Y')
('FR', 'FR629810', 'FR855277', 'Y')
('FR', 'FR494010', 'FR332891', 'Y')
('FR', 'FR740500', 'FR907878', 'Y')
('FI', 'NB444135', 'NB234471', 'Y')
</code></pre>
<p>DF 2:</p>
<pre><code>country from to flag
('GB', 'GB390065', 'GB66903', 'Y')
('FR', 'FR418458', 'FR7656', 'Y')
('FR', 'FR629810', 'FR855277', 'Y')
('FR', 'FR4910', 'FR33891', 'Y')
('FR', 'FR740500', 'FR907878', 'Y')
('FI', 'NB444135', 'NB234471', 'Y')
</code></pre>
<p>我的预期产出:</p>
<pre><code>country from to flag Available
('FR', 'FR418458', 'FR7656', 'Y' df2)
('FR', 'FR4910', 'FR33891', 'Y' df2)
</code></pre>
<p>我在这里面临的挑战是<code>from column</code>和<code>to column</code>是相同的数据,只是当我尝试使用<code>merge function</code>时,它获取列中的任何一个并给出不符合要求的结果</p>
<p>我得到的结果是</p>
<pre><code> country_code from_cust_id ... to_cust_guid Merge_status
322443 DE DE180556 ... NaN left_only
322444 DE DE22191 ... NaN left_only
322445 DE DE2625168 ... NaN left_only
322446 DE DE17705 ... NaN left_only
322447 DE DE2556758 ... NaN left_only
[5 rows x 7 columns]
country_code from_cust_id ... to_cust_guid Merge_status
0 DE NaN ... DE485137 right_only
1 DE NaN ... DE467209 right_only
2 DE NaN ... DE651068 right_only
3 DE NaN ... DE459729 right_only
4 DE NaN ... DE448683 right_only
</code></pre>