在句号之间提取字符串，除非C

#!/usr/bin/python import sys import re vnumber_name = "FREDS CHIP SHOP. S & B SERVICES CO. & SONS LTD. 1-12 THE STREET" #vnumber_name = "SOME TEXT. BUSINESS NAME LTD. 1-12 THE STREET" #vnumber_name = "SIMPLE BUSINESS NAME LTD. 1-12 THE STREET" def test(vnumber_name): #ltd = re.search(r'.+\sLTD[.]?', vnumber_name) ltd = re.search(r'[.?][\s]{1,2}(?:[^.]+|(?!CO.))LTD[.]?', vnumber_name) if ltd: print "got it: " + ltd.group(0) else: print "nothing" test(vnumber_name)

1条回答

网友

1楼 · 发布于 2024-09-28 22:16:17

您可能希望排除多个缩写，因此这里有一个更灵活的方法，使用“negative lookbehind”：从字符串的开始到下一个句点（本例中，CO或{}）匹配字符串的下一个句点。非贪心的.*?（后面跟一个句点）使您匹配到第一个这样的句点。在

.*?(?<!..CO|CORP)\.

这将允许您正确地将字符串分解为“句子”。如果你只对以LTD结尾的那些感兴趣，你可以选择它们。在

相关问题更多 >

编程相关推荐

热门问题

热门文章