如何在python中匹配列表的一部分并返回其他部分

2024-10-02 12:26:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我们储存了电话线

['frontend2', 'ac1b360e-daa8-4102-bc7e-aae01ac5f6ab', 'POST', '2016-10-28T09:29:07.940000'],

在一个名为data的数组中。我们知道它在那里,因为:

>>> print data
[['frontend2', 'ac1b360e-daa8-4102-bc7e-aae01ac5f6ab', 'POST', '2016-10-28T09:29:07.940000'], ['worker42', 'ac1b360e-daa8-4102-bc7e-aae01ac5f6ab', 'HANDLE', '2016-10-28T09:29:07.970000'], ['frontend7', '2ef630e2-64fb-4100-8a04-07c4d25887b7', 'GET', '2016-10-28T09:29:07.970000'], ['frontend9', 'a9af2495-f2f0-42e3-81fa-d99d4bac5b9c', 'GET', '2016-10-28T09:29:07.990000'], ['frontend19', '0336af66-edff-48e0-958c-42d09d0efd7a', 'GET', '2016-10-28T09:29:08.010000'], ['frontend14', 'ebc80de2-3708-4aa5-88e4-d3c08a018961', 'GET', '2016-10-28T09:29:08.030000'], ['frontend16', '14fd9242-7a0c-4f42-ab0c-f8e6de21f948', 'GET', '2016-10-28T09:29:08.040000'], ['frontend2', 'ac1b360e-daa8-4102-bc7e-aae01ac5f6ab', 'RESPOND', '2016-10-28T09:29:08.050000'], ['frontend5', '8b3e6d9f-abbc-46c0-a458-05e6fd3bbe6c', 'POST', '2016-10-28T09:29:08.060000'], ['frontend3', 'd8389212-c91e-450b-8745-2cb121cb9623', 'POST', '2016-10-28T09:29:08.090000']]

甚至可以拉出整条线:

>>> print data[0]
['frontend2', 'ac1b360e-daa8-4102-bc7e-aae01ac5f6ab', 'POST', '2016-10-28T09:29:07.940000']

可以拉出管路的任何部分:

>>> print data[0][0]
frontend2

问题:我需要找到一行以frontend2开头并包含RESPOND的内容,然后拉出这行的其他部分

有人可能认为索引至少会找到它,但不会:

>>> data.index("frontend2")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: 'frontend2' is not in list
>>>

做这件事的Python式方法是什么?
理想情况下,我可以 资料[前端2][2] 它将扫描列表,找到匹配的第一行,然后返回2索引项(或者,对于脚本的另一部分,覆盖2项而不触及行的其余部分。)

过滤器将得到我所有的线;大概我可以进一步过滤,只得到get行?我还没有找到这方面的好文件;如有任何解释,我们将不胜感激。在列表理解模式下执行此操作会产生相同的结果

>>> print filter(lambda x: 'frontend2' in x, data)
[['frontend2', 'ac1b360e-daa8-4102-bc7e-aae01ac5f6ab', 'POST', '2016-10-28T09:29:07.940000'], ['frontend2', 'ac1b360e-daa8-4102-bc7e-aae01ac5f6ab', 'RESPOND', '2016-10-28T09:29:08.050000']]

一个潜在的解决方案可能是使用正则表达式和过滤器,但显然应该有更好的方法


Tags: 方法in过滤器列表datagetpostprint
2条回答

要使用列表理解,必须应用所有与筛选器中所需子列表匹配的条件:

>>> [lst for lst in data if  lst[0]=='frontend2' and 'RESPOND' in lst]
[['frontend2', 'ac1b360e-daa8-4102-bc7e-aae01ac5f6ab', 'RESPOND', '2016-10-28T09:29:08.050000']]

备选方案1:显而易见的

这是一种非常明显的方法,可以扫描列表中的每个元素并查找您需要的两个标记:

for line in data:
   if 'frontend2' in line and 'RESPOND' in line:
       print line

备选方案2:效率更高一点

更有效的替代方案是,如果您知道该行必须以^{开始

for line in data:
    if line[0] == 'frontend2' and 'RESPOND' in line:
        print line

备选方案3:使用过滤器

另一种选择是使用过滤器和您需要的所有条件:

print filter(lambda x: 'frontend2' in x and 'RESPOND' in x, data)
>>> [['frontend2', 'ac1b360e-daa8-4102-bc7e-aae01ac5f6ab', 'RESPOND', '2016-10-28T09:29:08.050000']]

相关问题 更多 >

    热门问题