2024-09-25 08:26:17 发布
网友
我正在开发一个功能,要求我识别在视频/音频剪辑中讲话的人。基本上,这些时间间隔将被标记,以便审计师稍后审查。 我计划使用ffmpeg的silencedetect来识别带有沉默的间隔,并假设其余的是交谈。 有没有更好的方法来做到这一点,因为我必须设置一个阈值分贝,以防止我听到耳语等。有没有一种方法可以获得音频/视频剪辑的音频图,其中我们知道每个点的分贝
目前没有回答
目前没有回答
相关问题 更多 >
编程相关推荐