擅长:python、mysql、java
<p>我想你正在丢失你需要的信息。您需要以某种方式保留词性数据,以便能够以正确的方式处理<code>('weirdly', 'talking')</code>之类的双元组。在</p>
<p>可能是bigram finder可以接受带标记的单词元组(我不熟悉nltk)。或者,您可能不得不求助于创建外部索引。如果是这样的话,这样的方法可能会奏效:</p>
<pre><code>part_of_speech = {word:tag for word,tag in posTagged}
best_bigrams = finger2.nbest(... as you like it ...)
verb_first_bigrams = [b if part_of_speech[b[1]] == 'RB' else (b[1],b[0]) for b in best_bigrams]
</code></pre>
<p>然后,用前面的动词,你可以把它转换成字典或列表或其他任何东西:</p>
^{2}$