回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我已经和熊猫一起工作了一段时间,但我还没有想出如何实现以下结果</p>
<p>DFA由包含活动和非活动LOB的记录组成。我想删除不活动的LOB。但各州之间的非活动LOB有所不同</p>
<p>DF B由列形式的状态和结果列中的非活动LOB组成</p>
<p>因此,我想要一个不包含任何非活动LOB的结果DF</p>
<p>例:OH中不活跃的LOB 78可能在MI中活跃。
理由:</p>
<p>在dfa中:您可以看到一条状态为OH和lob78的记录。我不希望此记录出现在DF C中,因为DF b中的OH列中存在78条记录,因此它被视为非活动记录</p>
<p>在dfa中:您可以看到状态为MI和lob78的记录。我希望记录在我的DF C中,因为DF b的MI列中没有78</p>
<p>DFA中有500k记录。运行时间不是问题,但如果少于5分钟就好了</p>
<p>(我从<code>dict : [{state: [list of inactive lob]}]</code>列表中读取dfb)</p>
<p>样本DFA:</p>
<pre><code>Name, state, LOB, ID
a , OH , 66 , 7979
aa , OH , 78 , 12341
bas , OH , 67 , 13434
basd, VT , 99 , 1241234
badf, MI , 77 , 12341234
bbdf, MI , 78 , 12341234
caff, VT , 66 , 2134
cdse, AZ , 01 , 232
</code></pre>
<p>样本DF B:</p>
<pre><code> OH , VT , MI
66 , 99 , 77
78 , 23
</code></pre>
<p>我想要一个DF C:</p>
<pre><code>Name, state, LOB, ID
bas , OH , 67 , 13434
bbdf, MI , 78 , 12341234
caff, VT , 66 , 2134
cdse, AZ , 01 , 232
</code></pre>