口袋斯芬克斯Python和设置声学模型?

2024-05-17 11:14:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在读这篇关于speech recognition的指南,它提到我需要三个项目来进行语音识别:声学模型、语言模型、语音词典。在

我想开始玩这个python demo,它使用Gstreamer从麦克风捕捉并重新采样到8kHz,16位PCM音频。在

我看到我可以指定语言模型和语音词典,我使用了一个[由cmu提供]:

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Language%20Model/

但是我很困惑我应该在哪里指定声学模型?gstreamer有自己的声学模型吗?我希望使用这里提供的声学模型来获得稍微好一点的结果:

^{pr2}$

(关于超链接,我很抱歉。我不能发布超过2个链接,代表少于10)


Tags: 项目模型语言httpdemo指南语音音频
1条回答
网友
1楼 · 发布于 2024-05-17 11:14:55
^{bq}$

可以使用gstreamer元素的hmm属性指定模型。就像教程里提到的一样

asr.set_property('lm', '/home/user/mylanguagemodel.lm')

你可以用

^{pr2}$

Does gstreamer have its own acoustic model I'm implicitly using?

是的,默认情况下,它使用发行版中的美英型号hub4wsj_sc_8k

相关问题 更多 >