为任何视频或音频文件自动生成字幕
autosub的Python项目详细描述
autosub是自动语音识别和字幕生成的实用工具。它以视频或音频文件作为输入,执行语音活动检测以查找语音区域,向google web speech api发出并行请求以生成这些区域的转录,(可选)将它们转换为其他语言,最后将生成的字幕保存到磁盘。它支持多种输入和输出语言(要查看是哪种语言,请分别使用–list src languages和–list dst languages作为参数运行实用程序),并且当前可以生成srt格式或简单json格式的字幕。