<p>要下载特定的数据集/模型,请使用<code>nltk.download()</code>函数,例如,如果要下载<code>punkt</code>语句标记器,请使用:</p>
<pre><code>$ python3
>>> import nltk
>>> nltk.download('punkt')
</code></pre>
<p>如果您不确定所需的数据/模型,可以从数据+模型的基本列表开始:</p>
<pre><code>>>> import nltk
>>> nltk.download('popular')
</code></pre>
<p>它将下载一个“热门”资源列表。</p>
<p>确保您拥有最新版本的<code>NLTK</code>,因为它总是在不断改进和维护:</p>
<pre><code>$ pip install --upgrade nltk
</code></pre>
<hr/>
<h2>编辑</h2>
<p>如果有人从<code>nltk</code>,从<a href="https://stackoverflow.com/a/38135306/610569">https://stackoverflow.com/a/38135306/610569</a>下载更大的数据集时避免了错误</p>
<pre><code>$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.zip
$ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite
$ python
>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it's already installed.
>>> dler.download('popular')
</code></pre>
<p>如果有人想找到<code>nltk_data</code>目录,请参阅<a href="https://stackoverflow.com/a/36383314/610569">https://stackoverflow.com/a/36383314/610569</a></p>
<p>要配置<code>nltk_data</code>路径,请参见<a href="https://stackoverflow.com/a/22987374/610569">https://stackoverflow.com/a/22987374/610569</a></p>