我试图定义一个语法,以便使用正则表达式解析器从文本中检索数量和结果。显然语法有问题,因为在结果中我只能看到数量。我在下面粘贴了一个示例文本和我正在使用的代码。用cess_-esp语料库对HMM标记者进行训练
grammar = r"""
fruits: {<NCFP000>}
quantity:{<Z>}
"""
regex_parser = nltk.RegexpParser(grammar)
cp = nltk.RegexpParser(grammar)
example=['quiero 3 cervezas']
for sent in example:
tokens = nltk.word_tokenize(sent)
taggex = hmm_tagger.tag(tokens)
print(taggex)
result = cp.parse(taggex)
result.draw()
尝试使用NLTK标记器而不是Markov标记器:
taggex = nltk.pos_tag(tokens)
我检查了它,它应该对您的代码也起作用
相关问题 更多 >
编程相关推荐