如何创建音频缓冲区以在几秒钟内访问麦克风输入

2024-10-06 11:37:42 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在尝试创建一个语音识别功能，可以激活一个热词。我找到了这个 snowboy包，可以创建一个hotword侦听器，该侦听器可以全天候侦听并在激活时运行特定任务

我的问题是，我需要在hotword检测时运行语音身份验证功能。假设我的热词是“你好”，我的语音认证需要输入“你好，请开门”。但是如果我在检测到热词后开始录制，我需要重复hello这个词。我怎样才能在不重复的情况下获得完整的“你好，请开门”录音

有没有一种方法，雪人可以输出简短的音频文件“你好”，它用来激活，如果是这样的话，那么我可以把它们结合起来

如果现在我可以创建一个音频缓冲区，它可以一直保存最后10秒的mics数据，而不会对cpu造成太大的影响。同时，这也需要与雪人共享麦克风

这是我的想法，但我不知道如何实施。请告诉我如何才能做到这一点或任何其他我可以得到完整的录音

请随意编辑问题，因为有些地方不清楚

谢谢

Tags：方法功能身份验证 hello 情况语音音频音频文件

0条回答

目前没有回答