以特定模式读取数据组

IU.WRT.00.MTR.1999.081.081015.txt IU.WRT.00.MTS.2007.229.022240.txt IU.WRT.00.MTR.2007.229.022240.txt IU.WRT.00.MTT.1999.081.081015.txt IU.WRT.00.MTS.1999.081.081015.txt IU.WRT.00.MTT.2007.229.022240.txt

import os import glob import matplotlib.pyplot as plt from collections import defaultdict def groupfiles(pattern): files = glob.glob(pattern) filedict = defaultdict(list) for file in files: parts = file.split(".") filedict[".".join([parts[5], parts[6], parts[7]])].append(file) for filegroup in filedict.values(): yield filegroup for relatedfiles in groupfiles('*.txt'): print(relatedfiles) for filename in relatedfiles: print(filename)

1条回答

网友

1楼 · 发布于 2024-10-01 11:23:20

使用适当的模式获取文件

files_1999 = glob.glob('IU.WRT.00.MT[RST].1999.081.081015.txt')

概括地说

years = set(file.split('.')[4] for file in glob.glob('*.txt'))
file_group = {}

for year in years:
    pattern = f'IU.WRT.00.MT[RST].{year}*.txt'
    file_group[year] = glob.glob(pattern)

输出

{
   "2007":[
      "IU.WRT.00.MTS.2007.229.022240.txt",
      "IU.WRT.00.MTR.2007.229.022240.txt",
      "IU.WRT.00.MTT.2007.229.022240.txt"
   ],
   "1999":[
      "IU.WRT.00.MTS.1999.081.081015.txt",
      "IU.WRT.00.MTR.1999.081.081015.txt",
      "IU.WRT.00.MTT.1999.081.081015.txt"
   ]
}

相关问题更多 >

编程相关推荐

热门问题

热门文章