回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我有一个数据帧<code>df1</code>,其中包含标记化字符串行:</p>
<pre><code>df1 = pd.DataFrame(data = {'tokens' : [['auditioned', 'lead', 'role', 'play',
'play'], ['kittens', 'adopted', 'family'], ['peanut', 'butter', 'jelly',
'sandwiches', 'favorite'], ['committee', 'decorated', 'gym'], ['surprise',
'party', 'best', 'friends']]})
</code></pre>
<p>我还有一个数据框<code>df2</code>,它包含单个单词字符串以及与每个单词相关的分数:</p>
^{pr2}$
<p>使用<code>df2</code>作为一种查找“表”的最佳方法是什么,我也可以使用它来帮助执行计算?在</p>
<p>对于<code>df1</code>中的每一行,我需要检查<code>df2</code>中是否存在任何单词。如果是这样,计算找到的单词数,并将结果存储在一个名为<code>word_count</code>的序列中(如果某个特定单词在<code>df1</code>中出现多次,则计算每次出现的次数)。另外,当<code>df1</code>中的一个单词存在于<code>df2</code>中时,将该单词的分数与在一个名为<code>total score</code>的序列中找到的任何其他单词相加。最终输出应该看起来像<code>df3</code>:</p>
<pre><code>df3 = pd.DataFrame(data = {'tokens' : [['auditioned', 'lead', 'role', 'play', 'play'], ['kittens', 'adopted', 'family'], ['peanut', 'butter', 'jelly', 'sandwiches', 'favorite'], ['committee', 'decorated', 'gym'], ['surprise', 'party', 'best', 'friends']], 'word_count' : [3, 1, 2, 1, 0], 'total_score' : [12, 1, 9, 4, None]})
</code></pre>