从Youtube抓取和处理音频、字幕的软件包
audio-caption-crawler-and-processor的Python项目详细描述
音频、字幕爬虫和处理器
下载并处理Youtube视频中的音频和字幕(字幕),以便进行语音AI
要求
- 当前需要python>;=3.6
- FFmpeg
使用
from accp import ACCP
playlist_name=""
playlist_url = ""
accp = ACCP(playlist_name, playlist_url)
accp.download_audio() #download audio from youtube
accp.download_caption() #download captions from youtube
accp.audio_split() #split
结果
^{pr2}$并且metadata.csv
应该如下所示:
{
0001.wav|그래서 사람들도 날 핍이라고 불렀다.,
0002.wav|크리스마스 덕분에 부엌에 먹을게 가득했다.,
0003.wav|조가 자신이 그 사람이라고 나섰다.,
...
}
并且alignment.json
应该如下所示:
{
"./datasets/playlist name/wavs/0001.wav": "그래서 사람들도 날 핍이라고 불렀다.",
"./datasets/playlist name/wavs/0002.wav": "크리스마스 덕분에 부엌에 먹을게 가득했다.",
"./datasets/playlist name/wavs/0003.wav": "조가 자신이 그 사람이라고 나섰다.",
}
- 项目
标签: