擅长:python、mysql、java
<p><code>FreqDist</code>只是一种字典,字典键只能通过完全匹配来工作。在</p>
<p>要使用regexp进行类似的操作,您需要使用一种非常困难的方法:迭代所有条目并将匹配的单词的计数相加。当然,这需要扫描整个列表,所以如果列表很大,它会很慢,而且你需要做很多事情。在</p>
<p>如果只通过前缀进行匹配,请使用名为“前缀树”或<a href="https://stackoverflow.com/questions/11015320/how-to-create-a-trie-in-python">"trie"</a>的数据结构。你大概能猜到它是干什么的。一个简单的解决方法是在<code>FreqDist</code>中记录你看到的每个单词的每个前缀的计数(因此不仅仅是整个单词)。在</p>