我刚刚开始学习,在Python中遇到了一个问题。你知道吗
我有一个srt文件(副标题)。Name-sub。它看起来像:
8
00:01:03,090 --> 00:01:05,260
<b><font color="#008080">MATER:</font></b> Yes, sir, you did.
<b><font color="#808000">(MCQUEEN GASPS)</font></b>
9
00:01:05,290 --> 00:01:07,230
You used to say
that all the time.
在Python中,它看起来像:
'3', '00:00:46,570 --> 00:00:48,670', '<b><font color="#008080">MCQUEEN:</font></b> Okay, here we go.', '', '4', '00:00:48,710 --> 00:00:52,280', 'Focus. Speed. I am speed.', '', '5', '00:00:52,310 --> 00:00:54,250', '<b><font color="#808000">(ENGINES ROARING)</font></b>', '',
另外,我还有一个单词列表(name-noun)。它看起来像:
['man', 'poster', 'motivation', 'son' ... 'boy']
让我们看看这个例子:
...'4', '00:00:48,710 --> 00:00:52,280', 'Focus. Speed. I am speed.', '', '5',....
我需要做的是从副标题列表中找到单词(第一次出现,作为一个插图,“Speed”),并进入列表中单词出现的时间(00:00:48710-->;00:00:52280)和序列号(4),它位于文档中时间之前。我试图通过indx获得这些信息,但不幸的是我没有成功。你知道吗
你能帮我怎么做吗?)你知道吗
欢迎使用SO和Python。虽然这不是一个答案,但我认为它可能会有所帮助。唯一的Python表库是Pandas。您可以将srt文件读入一个数据帧,然后从那里开始工作。(你需要学习做事情的语法,但这是一个很好的投资时间)
打印前5行
print(df.head())
给出:继续安东·vBR的建议:
您将得到一个元组列表,每个元组包含您要搜索的单词、出现的序列号和出现的时间范围。然后你就可以把这些元组写进csv文件或者别的什么。希望这有帮助。你知道吗
相关问题 更多 >
编程相关推荐