基于多对一关系将列表压缩在一起

list1=['LT50300281984137PAC00_sr_band1.tif', ,'LT50300281984137PAC00_sr_band2.tif' 'LT50300281984137PAC00_sr_band3.tif','LT50300281994260XXX03_sr_band1.tif', 'LT50300281994260XXX03_sr_band2.tif', 'LT50300281994260XXX03_sr_band3.tif']

[('LT50300281984137PAC00_sr_band1',LT50300281984137PAC00_sr_band2,LT50300281984137PAC00_sr_band3, 'LT50300281984137PAC00_mask.tif'), ('LT50300281994260XXX03_sr_band1.tif', 'LT50300281994260XXX03_sr_band2.tif','LT50300281994260XXX03_sr_band3.tif','LT50300281994260XXX03_mask.tif')]

3条回答

网友

1楼 · 编辑于 2024-06-26 13:40:00

也可以使用regex来完成。在

import re
list1=['LT50300281984137PAC00_sr_band1.tif'
       ,'LT50300281984137PAC00_sr_band2.tif',  
       'LT50300281984137PAC00_sr_band3.tif','LT50300281994260XXX03_sr_band1.tif',
       'LT50300281994260XXX03_sr_band2.tif',
       'LT50300281994260XXX03_sr_band3.tif']

list2=['LT50300281984137PAC00_mask.tif','LT50300281994260XXX03_mask.tif']

match = re.findall(r'(\b\w+(?:PAC00)\w+.\w+\b)'," ".join(list1))
tuple1 =  tuple(match+[list2[0]])


match = re.findall(r'(\b\w+(?:0XXX0)\w+.\w+\b)'," ".join(list1))
tuple2 =  tuple(match+[list2[1]])

print [tuple1,tuple2]

输出

^{pr2}$

网友

2楼 · 编辑于 2024-06-26 13:40:00

您可以使用列表理解和内置函数filter

In [24]: [tuple(filter(lambda x: x.startswith(e.split('_')[0]), list1)+[e]) for e in list2]
Out[24]:
[('LT50300281984137PAC00_sr_band1.tif',
  'LT50300281984137PAC00_sr_band2.tif',
  'LT50300281984137PAC00_sr_band3.tif',
  'LT50300281984137PAC00_mask.tif'),
 ('LT50300281994260XXX03_sr_band1.tif',
  'LT50300281994260XXX03_sr_band2.tif',
  'LT50300281994260XXX03_sr_band3.tif',
  'LT50300281994260XXX03_mask.tif')]

网友

3楼 · 编辑于 2024-06-26 13:40:00

您可以使用itertools.groupby：

from itertools import groupby

list1 = [
    'LT50300281984137PAC00_sr_band1.tif',
    'LT50300281984137PAC00_sr_band2.tif',
    'LT50300281984137PAC00_sr_band3.tif',
    'LT50300281994260XXX03_sr_band1.tif',
    'LT50300281994260XXX03_sr_band2.tif',
    'LT50300281994260XXX03_sr_band3.tif'
]

list2 = [
    'LT50300281984137PAC00_mask.tif',
    'LT50300281994260XXX03_mask.tif'
]

def extract_key(s):
    return s[:s.index('_')]

l = sorted(list1 + list2, key=extract_key)
l = [tuple(items) for s, items in groupby(l, key=extract_key)]

结果：

^{pr2}$

其思想是根据每个文件名（extract_key）的第一部分对两个列表的并集进行排序。然后使用groupby创建第一部分相同的组。在

相关问题更多 >

编程相关推荐

热门问题

热门文章