我的问题类似于这个未回答的问题:Using custom POS tags for NLTK chunking?,但我得到的错误是不同的。我试图分析一个句子,我已经添加了我自己的领域特定的标签。在
例如:
(u'greatest', 'P'), (u'internet', 'NN'), (u'ever', 'A'),
(u',', ','), (u'and', 'CC'), (u'its', 'PRP$'), (u'being', 'VBG'),
(u'slow', 'N'), (u'as', 'IN'), (u'hell', 'NN')`
其中(u'slow', 'N')
是一个自定义标记'N'
。在
我试图用以下方法来解析:
^{pr2}$但我得到了以下错误:
ValueError: Illegal chunk pattern: `{<A>?*<P>+}`
nltk.RegexpParser
是否处理自定义标记?有没有其他基于nltk或python的解析器可以做到这一点?在
在nltk.RegexpParser可以处理自定义标记。在
以下是如何修改代码以使其正常工作:
这是测试数据的结果:
^{pr2}$我不熟悉NTLK,但在Python正则表达式中,
?*
是一个语法错误。也许你指的是*?
,这是一个懒惰的量词。在相关问题 更多 >
编程相关推荐