2024-09-26 04:58:41 发布
网友
我正在寻找一种方法给英语文本计数动词短语在过去,现在和未来的时态。现在我使用NLTK,做一个词性标记,然后数一数“VBD”得到过去时态。但这还不够准确,所以我想我需要进一步使用分块,然后分析VP分块的具体时态模式。有什么东西能做到这一点吗?有什么进一步的阅读可能会有帮助吗?NLTK book主要集中在NP块上,我能找到的关于VP块的信息很少。
您可以使用Berkeley Parser或Stanford Parser来完成此操作。但我不知道是否有一个Python接口可供使用。
确切的答案取决于你打算使用哪一个切块,但是列表理解会让你走很长的路。这将获得使用不存在的chunker的动词短语数。
len([phrase for phrase in nltk.Chunker(sentence) if phrase[1] == 'VP'])
您可以采用更细粒度的方法来检测时态的数量。
您可以使用Berkeley Parser或Stanford Parser来完成此操作。但我不知道是否有一个Python接口可供使用。
确切的答案取决于你打算使用哪一个切块,但是列表理解会让你走很长的路。这将获得使用不存在的chunker的动词短语数。
您可以采用更细粒度的方法来检测时态的数量。
相关问题 更多 >
编程相关推荐