"分割 string 前的 "Mr." 或 "Mrs."

2条回答

网友

1楼 · 编辑于 2024-09-28 21:56:02

(.+?)(?=Mr\.|Mrs\.|$|(?<! )[A-Z])

试试看这个。看到了吗演示。抓住抓捕。在

https://regex101.com/r/sJ9gM7/59#python

^{pr2}$

网友

2楼 · 编辑于 2024-09-28 21:56:02

我建议您创建一个列表，列出所有可能的标题，这些标题可以先按名称排序：

>>> titles = "Mr\. Mrs\. Lady Sir".split()
['Mr\\.', 'Mrs\\.', 'Lady', 'Sir']

然后，您可以使用它们为这些标题创建regex，后跟一个空格。在

^{pr2}$

然后用这些标题加上一个单词来找出所有的名字和单词。在

>>> re.findall(title_opt + "[A-Z][a-z]+", text)
['Text', 'Mr. Xxxxx', 'Mrs. Yyyyy', 'Mrs. Zzzzz', 'Text', 'Word', 'Lady Zzzzz', 'Mr. Xxxxx']

或者，根据您自己的方法，一旦您有了名称、单词和标题的列表，就可以使用迭代器将标题与迭代器中的next单词连接起来。在

>>> names = ['Text', 'Mr.', 'Xxxxx', 'Mrs.', 'Yyyyy', 'Mrs.', 'Zzzzz', 'Text', 'Word', 'Lady', 'Zzzzz', 'Mr.', 'Xxxxx']
>>> titles = set("Mr. Mrs. Lady Sir".split())
>>> iterator = iter(names)
>>> [s if s not in titles else s + " " + next(iterator) for s in iterator]
['Text', 'Mr. Xxxxx', 'Mrs. Yyyyy', 'Mrs. Zzzzz', 'Text', 'Word', 'Lady Zzzzz', 'Mr. Xxxxx']

相关问题更多 >

编程相关推荐

热门问题

热门文章

"分割 string 前的 "Mr." 或 "Mrs."

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >