如何提取位置或持续时间旁边的单词?python中最好的正则表达式是什么?你知道吗
你知道吗示例:-你知道吗
Kathick Kumar,班加罗尔人,他是一个伟大的人,居住于1980年3月29日至2014年12月21日。你知道吗
在上面的示例中,我想提取location之前的单词和duration之前的单词。这里的位置和持续时间不是固定的,在python中,什么样的正则表达式才是最好的呢?或者我们可以用nltk来做这个?你知道吗
想要的输出:-你知道吗
输出-1:karthuck Kumar(这里的关键字是位置)
输出-2:谁是一个伟大的人,从何而来(这里的关键字是持续时间)
我建议使用Lookaheads。你知道吗
在您的示例中,假设希望单词位于班加罗尔和1980年3月29日至2014年12月21日之前,则可以使用lookaheads(和lookbehinds)来获得相关匹配。你知道吗
我使用了这个正则表达式:
(.*)(?>Bangalore)(.+)(?=29th March 1980 - 21 Dec 2014)
并捕获了括号中的文本,可以使用\1
和\2
访问这些文本。你知道吗DEMO
相关问题 更多 >
编程相关推荐