拆分两个名字可能有共同姓氏的名字列表问题的回答

拆分两个名字可能有共同姓氏的名字列表

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

在Python中，我通过一个大的名称列表进行解析，如下所示： <pre><code>[u' Ron Iervolino, Trish Iervolino, Russ Middleton, and Lisa Middleton ', u' Barbara Loughlin, Dr. Gerald Loughlin, and Debbie Gelston ', u' Julianne Michelle ... '] </code></pre> 我可以用这个把它们分成单独的名字： <pre><code>re.split('(([A-Z]\.?\s?)*([A-Z][a-z]+\.?\s?)+([A-Z]\.?\s?[a-z]*)*)', line)[1::5] </code></pre> 例如，如果我在上面示例数据的第一个位置调用它，它将返回： <pre><code>[u'Ron Iervolino', u'Trish Iervolino', u'Russ Middleton', u'Lisa Middleton '] </code></pre> 很酷。这适用于很多情况。我遇到的问题是，在某些情况下，名称的格式是： <pre><code>[ ..., u' Kelly and Tom Murro ', ...] </code></pre> 这是指凯利·默罗和汤姆·默罗。有什么办法能让我和这个案子匹配吗？我有一个函数执行regex操作（调用重新拆分)，所以我的想法是添加到这个函数中，首先检查是否存在这种情况。如果列表中有两个以上的名字，则显示为姓氏与两个名字成对出现。只有当列表中有两个（而且只有两个）名字并且他们共享一个姓氏时，才会出现这种情况。你知道吗 编辑 我喜欢“alpha bravo”解决方案的简单性。为了理解发生了什么，我把Regex101站点演示弄得一团糟，并让它生成了一些代码。代码似乎没有任何作用，也许我的大脑因为盯着它看了这么久而融化了。有什么建议吗？你知道吗 <pre><code>import re p = re.compile(ur'([A-Z]\w+\s+[A-Z]\w+)|([A-Z]\w+)(?=\s+and\s+[A-Z]\w+\s+([A-Z]\w+))', re.MULTILINE) test_str = u"Russ Middleton and Lisa Murro\nRon Iervolino, Trish and Russ Middleton, and Lisa Middleton \nRon Iervolino, Kelly and Tom Murro\nRon Iervolino, Trish and Russ Middleton and Lisa Middleton " subst = u"$1$2 $3" result = re.sub(p, subst, test_str) </code></pre> 变量<code>result</code>只是替换字符串。你知道吗

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

拆分两个名字可能有共同姓氏的名字列表

1 个回答

相关Python问题