<pre><code>import nltk
from nltk.tokenize import word_tokenize
txt = "finding a common place isn't commonly available among commoners place"
fd = nltk.FreqDist()
for w in word_tokenize(a.lower()):
fd[w] += 1
</code></pre>
<p>我有上面的脚本,工作得很好。如果我<code>fd['place']</code>我得到2,如果我输入<code>fd['common']</code>我得到1。在</p>
<p>是否可以键入类似于<code>fd['common*']</code>(这不起作用)来获得3,并可能获得这些匹配项的列表?三个匹配将是<code>(common, commonly, commoners)</code></p>
<p>我假设它与<code>regex</code>有关,但不确定如何用<code>FreqDist()</code>实现</p>
<p>如果没有,是否有其他软件包可以做到这一点?在</p>
<p>利用<a href="http://www.nltk.org/book/ch03.html" rel="nofollow">Ch 3.4</a>这就是我最后要做的</p>
<pre><code>import re
for w in fd:
if re.search('common', w):
print(w,fd[w])
</code></pre>