lookahead不适用于python regex和n

2024-09-29 21:58:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图使用POS-tag和regex提取主语(它就在动词之前),但失败了。 我的职责是:

def get_SOP(sent):
 tokens = nltk.word_tokenize(sent)
 tags = nltk.pos_tag(tokens)

 grammar = r"""
 Sub:    {(<DT>?<JJ>*<NN>*)(?=(<VB.*>?<VB.*>?))}
 Pre:  {<VB.*>?<VB.*>?}
 """
 cp = nltk.RegexpParser(grammar)
 return cp.parse(tags)

对于句子:女孩她坐在阳台上。 我有一棵树Sub:那个女孩普雷德:他坐着吗还有一个Sub:在阳台,这是不正确的,所以展望是不适合我。 我使用的是python3.4。和nltk 3.2.1。你知道吗


Tags: postagtags动词cpregexsentvb

热门问题