<p>我试图将1个数据帧列中的单词或stings与同一df中的另一个列进行比较,并只输出匹配单词的第3列。在</p>
<pre><code>input
Col1
the cat crossed a road
the dog barked
the chicken barked
Col2
the cat alligator
some words here
chicken soup
desired result
Col3
the cat
NULL
chicken
</code></pre>
<p>这是我所拥有的,只是有一个错误。在</p>
^{pr2}$
<p>错误是
TypeError:字符串索引必须是整数</p>
<p>检查</p>
<pre><code>l=[' '.join([t for t in x if t in y]) for x, y in zip(df1.Col1.str.split(' '),df2.Col2.str.split(' '))]
pd.DataFrame({'Col3':l})
Out[695]:
Col3
0 the cat
1
2 chicken
</code></pre>