擅长:python、mysql、java
<p>你做错的是这个循环-</p>
<pre><code>for row1 in master:
for row2 in subsetCopy:
if row1[0] != row2[0]:
count=count+1
untagged.writerow(row1)
</code></pre>
<p>对于<code>master</code>中的每一行1,它会将id与<code>row2</code>(使用<code>id</code>)进行比较,然后如果它们不相等,则将该行1写入未标记。这将导致<code>row1</code>被写入<code>untagged</code>很多次,就像<code>subsetCopy</code>中有不相关的行一样,这不是检查{<cd4>}的id是否存在于子集中的方法。在</p>
<p>您需要首先遍历<code>subsetCopy</code>中的每一行,然后将其保存在一个集合中,然后将要检查的内容与该集合进行比较。示例-</p>
^{pr2}$