Python。迭代文件列表，查找相同的文件名，但扩展名不同

2条回答

网友

1楼 · 编辑于 2024-06-26 09:06:34

你对你的问题采取了错误的方法。最简单的方法是使用os.path.splitext确定文件的基名，并根据它对它们进行分组。一种可能的方法是使用itertools.groupby

实施

groups = {key: set(value)
      for key, value in groupby(sorted(mylist,
                                       key = lambda e: os.path.splitext(e)[0]),
                                key = lambda e: os.path.splitext(e)[0])}

示例

^{pr2}$

网友

2楼 · 编辑于 2024-06-26 09:06:34

我将任务分成几个独立的关注点：首先构建字典，用相同的根名称分组文件；然后检查哪些文件同时具有视频和字幕文件。（请不要使用regex来分割文件名，os.path在这里做得更好）。在

from collections import defaultdict
import os

mylist = ['movie1.mp4','movie2.srt','movie1.srt','movie3.mp4','movie1.mp4']

movies = defaultdict(dict)
for filename in mylist:
    name, ext = os.path.splitext(filename)
    movies[name][ext] = filename

sub_extentions = set(['.txt', '.srt'])
movie_extensions = set(['.mp4', '.avi'])


for name, files in movies.items():
    files_set = set(files.keys())
    if not files_set & sub_extentions:
        continue # no subs
    elif not files_set & movie_extensions:
        continue # no movie
    else:
        print name, files.values()
# output: movie1 ['movie1.srt', 'movie1.mp4']

另外，你打算如何处理带有附加字幕的.mkv文件？；）

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python。迭代文件列表，查找相同的文件名，但扩展名不同

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >