基于子集列表的排序列表（无嵌套循环）

fruits = ['apple', 'banana', 'orange'] # "master list" labels = ['banana2', 'apple2', 'orange1', 'banana1', 'apple1', 'apple3'] # "long list" new_list = [] for fruit in fruits: for label in labels: if fruit in label: new_list.append(label)

3条回答

网友

1楼 · 编辑于 2024-06-23 18:56:42

另一个简单的方法：

import re

fruits = ['apple', 'banana', 'orange']  # "master list"
labels = ['banana2', 'apple2', 'orange1', 'banana1', 'apple10', 'apple3']  # "long list"

def normal_sort(text):
    return [int(c) if c.isdigit() else c for c in re.split('(\d+)', text)]

def func(x):
    x = " ".join(re.findall("[a-zA-Z]+", x))
    return x

print(sorted(sorted(labels, key=func), key=normal_sort))
# ['apple2', 'apple3', 'apple10', 'banana1', 'banana2', 'orange1']

网友

2楼 · 编辑于 2024-06-23 18:56:42

这里有一种方法，使用^{}导出排序顺序。你知道吗

fruits = ['apple', 'banana', 'orange']
labels = ['banana2', 'apple2', 'orange1', 'banana1', 'apple1', 'apple3']

res = sorted(labels, key=lambda x: fruits.index(x[:-1]))

# ['apple2', 'apple1', 'apple3', 'banana2', 'banana1', 'orange1']

也可以使用tuple作为排序键，并结合一些正则表达式来分隔任意大小的整数。你知道吗

import re

fruits = ['apple', 'banana', 'orange']
labels = ['banana2', 'apple2', 'orange1', 'banana1', 'apple10', 'apple3']

def sorter(mystr, fruits):
    str_split = re.match(r'([a-z]+)([0-9]+)', mystr, re.I).groups()
    return (fruits.index(str_split[0]), int(str_split[1]))

res2 = sorted(labels, key=lambda x: sorter(x, fruits))

# ['apple2', 'apple3', 'apple10', 'banana1', 'banana2', 'orange1']

网友

3楼 · 编辑于 2024-06-23 18:56:42

有几点需要改进：

您不需要if fruit in label:，只需要使用if fruit == label[0:len(fruit)]，因为您不需要完整的子字符串搜索，只需要开始。
您可以先对labels排序，这样当您找到第一个时，您就可以添加直到检查失败，然后跳过其余的，因为这样您就可以确定它们不再匹配了。显然，排序是有成本的，但它仍然应该比每次都检查更有效。您需要一份副本，以免丢失有关它们最初是如何排序的参考资料。

相关问题更多 >

编程相关推荐

热门问题

热门文章

基于子集列表的排序列表（无嵌套循环）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >