如何创建音频缓冲区以在几秒钟内访问麦克风输入

2024-10-06 11:37:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试创建一个语音识别功能,可以激活一个热词。我找到了这个 snowboy包,可以创建一个hotword侦听器,该侦听器可以全天候侦听并在激活时运行特定任务

我的问题是,我需要在hotword检测时运行语音身份验证功能。假设我的热词是“你好”,我的语音认证需要输入“你好,请开门”。但是如果我在检测到热词后开始录制,我需要重复hello这个词。我怎样才能在不重复的情况下获得完整的“你好,请开门”录音

有没有一种方法,雪人可以输出简短的音频文件“你好”,它用来激活,如果是这样的话,那么我可以把它们结合起来

如果现在我可以创建一个音频缓冲区,它可以一直保存最后10秒的mics数据,而不会对cpu造成太大的影响。同时,这也需要与雪人共享麦克风

这是我的想法,但我不知道如何实施。请告诉我如何才能做到这一点或任何其他我可以得到完整的录音

请随意编辑问题,因为有些地方不清楚

谢谢


Tags: 方法功能身份验证hello情况语音音频音频文件