如何解决GMM HMM在语音识别中的训练问题?

2024-06-28 11:33:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在进行coice识别研究,通过对amr wb(G722.2)编码的文件进行解码,我将一个语音数据集转换为LSF(线谱频率),我构建了一个数据集,每个帧包含16个ISF/LSF向量的文件

我使用了一个运行良好的python代码,用于wav格式的同一数据集的MFCC特性;但当数据集转换成LSf向量时,我在开始训练和拟合GMMmmm模型时得到了信息

错误消息:

“base.py”,第469行,向前传球 返回logsumexp(fwdlattice[-1]),fwdlattice

索引器:索引-1超出大小为0的轴0的界限


Tags: 文件数据代码编码语音解码向量频率