我试图使用POS-tag和regex提取主语(它就在动词之前),但失败了。 我的职责是:
def get_SOP(sent):
tokens = nltk.word_tokenize(sent)
tags = nltk.pos_tag(tokens)
grammar = r"""
Sub: {(<DT>?<JJ>*<NN>*)(?=(<VB.*>?<VB.*>?))}
Pre: {<VB.*>?<VB.*>?}
"""
cp = nltk.RegexpParser(grammar)
return cp.parse(tags)
对于句子:女孩她坐在阳台上。 我有一棵树Sub:那个女孩普雷德:他坐着吗还有一个Sub:在阳台,这是不正确的,所以展望是不适合我。 我使用的是python3.4。和nltk 3.2.1。你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐