在python中提取位置或持续时间旁边的单词

2024-06-30 16:18:09 发布

您现在位置:Python中文网/ 问答频道 /正文

如何提取位置或持续时间旁边的单词?python中最好的正则表达式是什么?你知道吗

你知道吗示例:-你知道吗

Kathick Kumar,班加罗尔人,他是一个伟大的人,居住于1980年3月29日至2014年12月21日。你知道吗

在上面的示例中,我想提取location之前的单词和duration之前的单词。这里的位置和持续时间不是固定的,在python中,什么样的正则表达式才是最好的呢?或者我们可以用nltk来做这个?你知道吗

想要的输出:-你知道吗

输出-1:karthuck Kumar(这里的关键字是位置)

输出-2:谁是一个伟大的人,从何而来(这里的关键字是持续时间)


Tags: 示例location关键字单词持续时间durationnltkkumar
1条回答
网友
1楼 · 发布于 2024-06-30 16:18:09

我建议使用Lookaheads。你知道吗

在您的示例中,假设希望单词位于班加罗尔1980年3月29日至2014年12月21日之前,则可以使用lookaheads(和lookbehinds)来获得相关匹配。你知道吗

我使用了这个正则表达式:(.*)(?>Bangalore)(.+)(?=29th March 1980 - 21 Dec 2014)并捕获了括号中的文本,可以使用\1\2访问这些文本。你知道吗

DEMO

相关问题 更多 >