使用nltk.download()下载时出错

2024-09-27 19:13:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用Python尝试NLTK包。我试图使用nltk.download()下载NLTK。我收到了这样的错误信息。如何解决这个问题?谢谢。

我使用的系统是安装在VMware下的Ubuntu。IDE是Spyder。

enter image description here

使用nltk.download('all')后,它可以下载一些包,但在下载oanc_masc时会收到错误消息

enter image description here


Tags: 消息ubuntudownload系统错误allidevmware
2条回答

要下载特定的数据集/模型,请使用nltk.download()函数,例如,如果要下载punkt语句标记器,请使用:

$ python3
>>> import nltk
>>> nltk.download('punkt')

如果您不确定所需的数据/模型,可以从数据+模型的基本列表开始:

>>> import nltk
>>> nltk.download('popular')

它将下载一个“热门”资源列表。

确保您拥有最新版本的NLTK,因为它总是在不断改进和维护:

$ pip install --upgrade nltk

编辑

如果有人从nltk,从https://stackoverflow.com/a/38135306/610569下载更大的数据集时避免了错误

$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.zip
$ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite
$ python

>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it's already installed.
>>> dler.download('popular')

如果有人想找到nltk_data目录,请参阅https://stackoverflow.com/a/36383314/610569

要配置nltk_data路径,请参见https://stackoverflow.com/a/22987374/610569

从命令行导入nltk后,尝试

nltk.download('popular', halt_on_error=False)

出错后,它将要求重试损坏的包,只需拒绝n,它将继续正确的包。

相关问题 更多 >

    热门问题