Python NLTK错误:找不到NLTK中的english.pickle资源

2024-05-02 19:57:34 发布

您现在位置:Python中文网/ 问答频道 /正文

在Python中尝试学习NLP和情绪分析,并遇到了NLTK。做了一些教程,但是由于标记化功能对我不起作用(命令行是说我没有资源),所以被它卡住了。

我已经试过安装punkt,虽然已经下载,但命令行仍然显示相同的错误:

Resource u'taggers/maxent_treebank_pos_tagger/english.pickle'
not found.  Please use the NLTK Downloader to obtain the
resource:  >>> nltk.download()
Searched in:
  - 'C:\\Users\\JeromePogi/nltk_data'
  - 'C:\\nltk_data'
  - 'D:\\nltk_data'
  - 'E:\\nltk_data'
  - 'C:\\Python27\\nltk_data'
  - 'C:\\Python27\\lib\\nltk_data'
  - 'C:\\Users\\JeromePogi\\AppData\\Roaming\\nltk_data'
  - u''

我已经尝试了所有的方法,包括将nltk_数据文件夹放在它搜索过的每个目录中,但是没有成功。如何解决此错误?


Tags: the命令行标记功能datanlp错误教程
3条回答

尝试在python控制台中使用nltk.download()安装“maxent_treebank_pos_tagger”

在我的例子中,问题是我没有正确地意识到,如何将语言作为参数传递。我的代码是:

word_tokenize('So was he doing.', 'en')

这是错误的。使用完整的语言名称

在shell/terminal/cmd中,您可以使用:

python -m nltk.downloader maxent_treebank_pos_tagger

(可能需要在Linux上使用sudo)

它将安装maxent_treebank_pos_tagger(即NLTK中的标准treebank POS标记器)并修复您的问题。

相关问题 更多 >