根据可变字符串和可变块长度将列表拆分为子列表

3条回答

网友

1楼 · 编辑于 2024-09-25 14:30:31

获取startswith('splitter')元素的索引，然后在这些索引处对列表进行切片

sl = ['splitter001','stringA','stringB','splitter_1234','stringC']

si = [i for i, e in enumerate(sl) if e.startswith('splitter')]
[sl[i:j] for i, j in zip(si, si[1:] + [len(sl)])]

Out[66]: [['splitter001', 'stringA', 'stringB'], ['splitter_1234', 'stringC']]

网友

2楼 · 编辑于 2024-09-25 14:30:31

这里有一种方法可以使用groupby。我们告诉groupby查找以“splitter”开头的字符串。这将创建两种类型的组：以“splitter”开头的字符串和所有其他字符串。例如

from itertools import groupby

data = ['splitter001','stringA','stringB','splitter_1234','stringC']

for k, g in groupby(data, key=lambda s: s.startswith('splitter')):
    print(k, list(g))

输出

^{pr2}$

所以我们可以把这些组分成两个列表，然后将它们压缩在一起，形成最终的列表。在

from itertools import groupby

data = ['splitter001','stringA','stringB','splitter_1234','stringC']

head = []
tail = []
for k, g in groupby(data, key=lambda s: s.startswith('splitter')):
    if k:
        head.append(list(g))
    else:
        tail.append(list(g))

out = [u+v for u, v in zip(head, tail)]
print(out)

输出

[['splitter001', 'stringA', 'stringB'], ['splitter_1234', 'stringC']]

这里有一个更简洁的方法来完成同样的事情，使用列表列表来存储头和尾列表：

from itertools import groupby

data = ['splitter001','stringA','stringB','splitter_1234','stringC']
results = [[], []]
for k, g in groupby(data, key=lambda s: s.startswith('splitter')):
    results[k].append(list(g))

out = [v+u for u, v in zip(*results)]
print(out)

输出

[['splitter001', 'stringA', 'stringB'], ['splitter_1234', 'stringC']]

如果要在单独的行上打印每个子列表，简单的方法是使用for循环来完成，而不是创建out列表。在

for u, v in zip(*results):
    print(v + u)

输出

['splitter001', 'stringA', 'stringB']
['splitter_1234', 'stringC']

另一种方法是将子列表转换为字符串，然后用换行符将它们连接在一起以创建一个大字符串。在

print('\n'.join([str(v + u) for u, v in zip(*results)]))

最后一个变体将两种类型的组存储到一个迭代器对象中。我想你会同意以前的版本更容易阅读。：）

it = iter(list(g) for k, g in groupby(data, key=lambda s: s.startswith('splitter')))
out = [u+v for u, v in zip(it, it)]

网友

3楼 · 编辑于 2024-09-25 14:30:31

下面是一种使用for循环的方法，如您所述，它处理第二组的情况：

# define list of strings for input
strings = ['splitter001','stringA','stringB','splitter_1234','stringC']
split_strings = []  # this is going to hold the final output
current_list = []  # this is a temporary list

# loop over strings in the input
for s in strings:
    if 'splitter' in s:
        # if current_list is not empty
        if current_list:
            split_strings.append(current_list)  # append to output
            current_list = []  # reset current_list
    current_list.append(s)

# outside of the loop, append the leftover strings (if any)
if current_list:
    split_strings.append(current_list)

这里的关键是在循环之外的末尾再执行一次附加，以捕获最后一个组。在

输出：

^{pr2}$

编辑：添加代码说明。在

我们创建一个临时变量current_list，以保存将附加到最终输出split_strings的每个列表。在

循环输入中的字符串。对于每个字符串s，检查它是否包含'splitter'。如果有，并且current_list不是空的，这意味着我们已经找到了下一个分隔符。将current_list追加到输出并清除它，这样我们就可以开始收集下一组字符串的项。在

检查之后，将当前字符串追加到current_list。这是因为我们在找到分隔符后将其清除（设置为[]）。在

在列表的末尾，我们将剩余的内容附加到输出中，如果有的话。在

相关问题更多 >

编程相关推荐

热门问题

热门文章