如何在Python中基于相似位置的字符/模式对文件进行分组？问题的回答

如何在Python中基于相似位置的字符/模式对文件进行分组？

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我在不同文件夹的列表中有一组文件名，如下所示： 输入文件 <pre><code>['ABC.dat', 'ABC10.dat', 'ABC956.dat', 'ABC_DEF_1.dat', 'ABC_DEF_2.dat', 'ABC_DEF_3.dat', 'ABC10_DEF_1.dat', 'ABC10_DEF_2.dat', 'ABC10_DEF_3.dat', 'ABC956_DEF_1.dat', 'ABC956_DEF_2.dat', 'ABC956_DEF_3.dat', 'XYZ_ABC_1.dat', 'XYZ_ABC_2.dat', 'XYZ10_ABC_1.dat', 'XYZ10_ABC_2.dat', 'XYZ956_ABC_1.dat', 'XYZ956_ABC_2.dat', 'XYZ_PQR_JKL.dat', 'XYZ_PQR_JKL_1.dat', 'XYZ_PQR10_JKL.dat', 'XYZ_PQR10_JKL_1.dat', 'XYZ_PQR956_JKL.dat', 'XYZ_PQR956_JKL_1.dat'] </code></pre> 我想将文件分组如下： 输出列表 <pre><code>[['ABC.dat', 'ABC10.dat', 'ABC956.dat'], ['ABC_DEF_1.dat', 'ABC10_DEF_1.dat.dat', 'ABC956_DEF_1.dat'], ['ABC_DEF_2.dat', 'ABC10_DEF_2.dat.dat', 'ABC956_DEF_2.dat'], ['ABC_DEF_3.dat', 'ABC10_DEF_3.dat.dat', 'ABC956_DEF_3.dat'], ['XYZ_ABC_1.dat', 'XYZ10_ABC_1.dat', 'XYZ956_ABC_1.dat'], ['XYZ_ABC_2.dat', 'XYZ10_ABC_2.dat', 'XYZ956_ABC_2.dat'], ['XYZ_PQR_JKL.dat', 'XYZ_PQR10_JKL.dat', 'XYZ_PQR956_JKL.dat'], ['XYZ_PQR_JKL_1.dat', 'XYZ_PQR10_JKL_1.dat', 'XYZ_PQR956_JKL_1.dat']] </code></pre> 也就是说，应该根据文件的模式对文件进行分组。注：DEF_1和DEF_2必须单独分组。数字10956是随机的，也就是说，它们以前是未知的。下面给出了一个MWE，它基于从<a href="https://gis.stackexchange.com/a/206053">OP</a>获得的前几个字母进行分组，如何将它扩展到DEF的其他字母。你知道吗 MWE <pre><code>import os import random import errno import itertools from itertools import repeat #-------------------------------------- # Main rename code for root, dirs, files in os.walk('./input_folder'): for dir in dirs: print (dir) output_files = [s for s in os.listdir(os.path.join(root,dir)) if s.endswith('.dat')] groups = [list(g) for _, g in itertools.groupby(sorted(output_files), lambda x: x[0:2])] # obtained from Aaron's answer https://gis.stackexchange.com/a/206053 print (groups) </code></pre>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

如何在Python中基于相似位置的字符/模式对文件进行分组？

1 个回答

相关Python问题