Python、嵌套循环、匹配和performan

import Levenshtein listoflastnames=(['Jones', 'Sallah']) listoffullnames=(['Henry', 'Jones', 'Junior'],['Indiana', 'Jones']) def match_strings(lastname, listofnames): match=0 matchedidx=[] for index, nameelement in enumerate(listofnames): if lastname[0]==nameelement [0]: if Levenshtein.distance(nameelement, lastname)<2: matchedidx.append(index) match=match+1 if match==1: newnamelist = [i for j, i in enumerate(listofnames) if j not in matchedidx] return 1, newnamelist return 0, listofnames for x in listoflastnames: for y in listoffullnames: match, newlistofnames=match_strings(x,y) if match==1: #go to first name match...

1条回答

网友

1楼 · 发布于 2024-10-02 08:27:25

这简化了match_string函数中的for循环，但在我的测试中并没有显著提高速度。最大的损失是在具有姓氏和全名的两个for循环中。在

def match_strings(lastname, listofnames):
    firstCaseMatched = [name for name in listofnames if lastname[0] == name[0]]
    if len(firstCaseMatched):
        matchedidx = [index for index, ame in enumerate(firstCaseMatched) if Levenshtein.distance(lastname, name) < 2]
        match = len(matchedidx)
    else:
        match = 0
    if match == 1:
        newnamelist = [i for j, i in enumerate(listofnames) if j not in matchedidx]
        return 1, newnamelist
    return 0, listofnames

您可能需要对已知姓氏的列表进行排序，将它们拆分为每个起始字符的dict。然后将名单中的每个名字与之对应。在

假定第一个元素的全名始终为第一个元素。您可以将比较限制为仅对其他元素进行比较。在

相关问题更多 >

编程相关推荐

热门问题

热门文章