口袋斯芬克斯Python和设置声学模型？

2024-05-17 11:14:55 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在读这篇关于speech recognition的指南，它提到我需要三个项目来进行语音识别：声学模型、语言模型、语音词典。在

我想开始玩这个python demo，它使用Gstreamer从麦克风捕捉并重新采样到8kHz，16位PCM音频。在

我看到我可以指定语言模型和语音词典，我使用了一个[由cmu提供]：

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Language%20Model/

但是我很困惑我应该在哪里指定声学模型？gstreamer有自己的声学模型吗？我希望使用这里提供的声学模型来获得稍微好一点的结果：

^{pr2}$

（关于超链接，我很抱歉。我不能发布超过2个链接，代表少于10）

Tags：项目模型语言 http demo 指南语音音频

1条回答

网友

1楼 · 发布于 2024-05-17 11:14:55

^{bq}$

可以使用gstreamer元素的hmm属性指定模型。就像教程里提到的一样

asr.set_property('lm', '/home/user/mylanguagemodel.lm')

你可以用

^{pr2}$

Does gstreamer have its own acoustic model I'm implicitly using?

是的，默认情况下，它使用发行版中的美英型号hub4wsj_sc_8k