如何读取文件夹和子文件夹*.wav;以及输入训练模型的特征提取?我有一个主文件夹,其中包含20个子文件夹。任何子文件夹都有6个子文件夹(20个扬声器,任何扬声器的声音(*.wav)分类为6类)。你知道吗 我想阅读所有的*.wav文件和特征提取。特征提取是我的神经网 ...2024-09-28 已阅读: n次
如何将可变长度的语音特征反馈给RNN(LSTM)进行语音识别?我正在尝试建立一个语音识别系统,这是一个序列模型。但我对如何将提取的特征(维数为40的fbank)提供给LSTM感到困惑。据我所知,有不同的方法将数据输入LSTM。然而,我怀疑是否能够完全理解它们。如 ...2024-09-28 已阅读: n次
TypeError:“float”对象不能解释为索引,是否可以解决此问题?正在尝试使用Python 2.x构建说话人识别项目。作为依赖项,项目依赖于scipy和{}。但是,当代码执行时,生成的堆栈跟踪是: Traceback (most recent call last ...2024-09-28 已阅读: n次
从FFT数据创建波形数据?正如您可能注意到的,我对python和声音处理非常陌生。我(希望)使用python和logfbank和mfcc函数从wave文件中提取FFT数据。(logfbank似乎给出了最有希望的数据,mfcc的 ...2024-09-28 已阅读: n次
数据扩充:需要扩充的训练数据集的比例是多少?我目前正在研究一个语音分类问题。我有1000个音频文件在每个类和有7个这样的类。我需要增加数据以获得更好的准确性。我正在使用librosa库进行数据扩充。对于每个音频文件,我使用下面的代码。你知道吗 ...2024-09-28 已阅读: n次
这个程序可以读取单个wav进行MFCC特征提取,我需要的程序,可以读取多个wav,并给出MFCC特征这个程序可以读取单个wav进行MFCC特征提取,我需要的程序,可以读取多个wav,并给出MFCC特征 from python_speech_features import mfcc from pyth ...2024-09-28 已阅读: n次
如何提取音频的MFCC特征并将其传递给CNN来训练模型?如何使用MFCC算法提取音频特征并与卷积神经网络一起训练模型?在 我用MFCC提取了音频的特征,文件包含浮点列,但我无法区分这些列?在 for filename in os.listdir(direc ...2024-09-28 已阅读: n次