擅长:python、mysql、java
<p>我会暂时远离NLTK的ngramodel。当前存在一个平滑错误,导致模型在n>;1时大大高估了可能性。这适用于包括WittenBellProbDist和LidstoneProbDist在内的所有估计器。我认为这个错误已经存在了几年了,这表明NLTK的这一部分没有经过很好的测试。在</p>
<p>参见:
<a href="https://github.com/nltk/nltk/issues/367" rel="nofollow">https://github.com/nltk/nltk/issues/367</a></p>