Python中文
首页
教程
问答
标签
搜索
登录
注册
使用MFCC进行语音识别
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我目前正在使用Fourier变换和Keras进行语音识别(说话人识别)。我听说MFCC是一个更好的选择,语音识别,但我不知道如何使用它。在</p> <p>我使用python(3)中的librosa来提取20个MFCC特性。我的问题是:我应该使用哪些MFCC功能来识别说话人?在</p> <p>除此之外,我不确定如何实现这些功能。我要做的是得到必要的特征,并为神经网络做一个长向量输入。然而,它也可以显示颜色,那么图像识别也可以吗,或者这是更针对语音,而不是说话人识别?在</p> <p>总之,我不确定我应该从哪里开始,因为我对图像识别不是很有经验,也不知道从哪里开始。在</p> <p>提前谢谢!!在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您可以将mfcc与稠密层/多层感知器一起使用,但是如果您有足够的训练数据,mel谱图上的卷积神经网络可能会表现更好。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么我的神经网络模型的准确性不能在这个训练集上得到提高?
2 回答
为什么我的神经网络模型的权重变化不大?
8 回答
为什么我的神经网络的成本不断增加?
5 回答
为什么我的神经网络的输入pickle文件是19GB?
6 回答
为什么我的神经网络给属性错误?“非类型”对象没有属性“形状”
6 回答
为什么我的神经网络训练这么慢?
3 回答
为什么我的神经网络输出错误?
5 回答
为什么我的神经网络预测适用于MNIST手绘图像时是正确的,而适用于我自己的手绘图像时是不正确的?
8 回答
为什么我的神经网络验证精度比我的训练精度高,而且它们都是常数?
7 回答
为什么我的私人用户间聊天会显示在其他用户的聊天档案中?
1 回答
为什么我的积分的绝对误差估计值大于积分(使用scipy.integrate.nqad)?
1 回答
为什么我的积层回归器得分比它的组件差?
7 回答
为什么我的移动方法不起作用?
4 回答
为什么我的稀疏张量不能转换成张量
3 回答
为什么我的稀疏张量不能转换成张量?
9 回答
为什么我的程序“停止”了?
3 回答
为什么我的程序一直试图占用所有可用的CPU
5 回答
为什么我的程序不使用指定的代理
10 回答
为什么我的程序不工作(python帮助中的反向函数)?
4 回答
为什么我的程序不工作时,我使用多处理模块
10 回答