我正在读这篇关于speech recognition的指南,它提到我需要三个项目来进行语音识别:声学模型、语言模型、语音词典。在
我想开始玩这个python demo,它使用Gstreamer从麦克风捕捉并重新采样到8kHz,16位PCM音频。在
我看到我可以指定语言模型和语音词典,我使用了一个[由cmu提供]:
http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Language%20Model/
但是我很困惑我应该在哪里指定声学模型?gstreamer有自己的声学模型吗?我希望使用这里提供的声学模型来获得稍微好一点的结果:
^{pr2}$(关于超链接,我很抱歉。我不能发布超过2个链接,代表少于10)
可以使用gstreamer元素的hmm属性指定模型。就像教程里提到的一样
你可以用
^{pr2}$是的,默认情况下,它使用发行版中的美英型号hub4wsj_sc_8k
相关问题 更多 >
编程相关推荐