根据lis中每个元素的内容获取元素表单列表

8 00:01:03,090 --> 00:01:05,260 MATER: Yes, sir, you did. (MCQUEEN GASPS) 9 00:01:05,290 --> 00:01:07,230 You used to say that all the time.

'3', '00:00:46,570 --> 00:00:48,670', 'MCQUEEN: Okay, here we go.', '', '4', '00:00:48,710 --> 00:00:52,280', 'Focus. Speed. I am speed.', '', '5', '00:00:52,310 --> 00:00:54,250', '(ENGINES ROARING)', '',

2条回答

网友

1楼 · 编辑于 2024-09-30 01:32:54

欢迎使用SO和Python。虽然这不是一个答案，但我认为它可能会有所帮助。唯一的Python表库是Pandas。您可以将srt文件读入一个数据帧，然后从那里开始工作。（你需要学习做事情的语法，但这是一个很好的投资时间）

import pandas as pd
import requests

# Lion King subtitle
data = requests.get("https://opensubtitles.co/download/67071").text

df = pd.DataFrame([i.split("\r\n") for i in data.split("\r\n\r\n")])
df = df.rename(columns={0:"Index",1:"Time",2:"Row1",3:"Row2"}).set_index("Index")

打印前5行print(df.head())给出：

                                Time                          Row1  Row2
Index                                                                   
1      00:01:01,600  > 00:01:05,800        <i>Nants ingonyama</i>  None
2      00:01:05,900  > 00:01:07,200           <i>Bagithi baba</i>  None
3      00:01:07,300  > 00:01:10,600  <i>Sithi uhhmm ingonyama</i>  None
4      00:01:10,700  > 00:01:13,300              <i>lngonyama</i>  None
5      00:01:13,300  > 00:01:16,400        <i>Nants ingonyama</i>  None

网友

2楼 · 编辑于 2024-09-30 01:32:54

继续安东·vBR的建议：

words=['ingonyama','king']
results=[]
for w in words:
    for row in df.itertuples():
        if row[2] is not None:
            if w in row[2].lower():
                results.append((w, row[0], row[1]))
        if row[3] is not None:
            if w in row[3].lower():
                results.append((w, row[0], row[1]))
print(results)

您将得到一个元组列表，每个元组包含您要搜索的单词、出现的序列号和出现的时间范围。然后你就可以把这些元组写进csv文件或者别的什么。希望这有帮助。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章