我正在使用NLTK,并尝试从以下文本中分块(AIM 20-40-60)
:
text = for more information refer to the Business Reporting Policy (AIM 20-40-60)
目前我正在使用以下块模式grammar = r"CHUNK:{<NN.*><CD>}"
,它能够完美地捕获AIM 20-40-60
部分。在
不过,我也希望括号()
也是块的一部分,而且由于我对正则表达式和分块比较陌生,我不知道捕获括号的确切正则表达式模式。在
Tags:
解决办法如下
grammar = r"CHUNK:{<\(><NNP><CD><\)>}"
相关问题 更多 >
编程相关推荐