擅长:python、mysql、java
<p>您可以在<code>useractivity_ids</code>中添加一个伪变量,然后使用pandas <code>merge</code>进行比较和筛选。你知道吗</p>
<pre><code>In [35]: useractivity_ids['tracker'] = 1
In [39]: reco_ids = reco_ids.merge(useractivity_ids, how='left')
In [40]: reco_ids[reco_ids['tracker'].isnull()].drop('tracker', axis=1)
Out[40]:
id content
0 1 100
1 1 101
5 4 105
</code></pre>
<p>在pandas的下一个版本(0.17)中,<code>merge</code>有一个<code>indicator</code>关键字,可以在不使用伪变量的情况下执行此操作。你知道吗</p>
<pre><code>In [47]: (pd.merge(reco_ids, useractivity_ids, how='left', indicator=True)
.query('_merge == "left_only"'))
Out[47]:
id content _merge
0 1 100 left_only
1 1 101 left_only
5 4 105 left_only
</code></pre>