Python fbank_专题 - Python中文网

如何读取文件夹和子文件夹*.wav；以及输入训练模型的特征提取？

我有一个主文件夹，其中包含20个子文件夹。任何子文件夹都有6个子文件夹（20个扬声器，任何扬声器的声音（*.wav）分类为6类）。你知道吗我想阅读所有的*.wav文件和特征提取。特征提取是我的神经网 ...

2024-09-28 已阅读: n次

我正在尝试建立一个语音识别系统，这是一个序列模型。但我对如何将提取的特征（维数为40的fbank）提供给LSTM感到困惑。据我所知，有不同的方法将数据输入LSTM。然而，我怀疑是否能够完全理解它们。如 ...

2024-09-28 已阅读: n次

正在尝试使用Python 2.x构建说话人识别项目。作为依赖项，项目依赖于scipy和{}。但是，当代码执行时，生成的堆栈跟踪是： Traceback (most recent call last ...

2024-09-28 已阅读: n次

正如您可能注意到的，我对python和声音处理非常陌生。我（希望）使用python和logfbank和mfcc函数从wave文件中提取FFT数据。（logfbank似乎给出了最有希望的数据，mfcc的 ...

2024-09-28 已阅读: n次

我目前正在研究一个语音分类问题。我有1000个音频文件在每个类和有7个这样的类。我需要增加数据以获得更好的准确性。我正在使用librosa库进行数据扩充。对于每个音频文件，我使用下面的代码。你知道吗 ...

2024-09-28 已阅读: n次

这个程序可以读取单个wav进行MFCC特征提取，我需要的程序，可以读取多个wav，并给出MFCC特征 from python_speech_features import mfcc from pyth ...

2024-09-28 已阅读: n次

如何使用MFCC算法提取音频特征并与卷积神经网络一起训练模型？在我用MFCC提取了音频的特征，文件包含浮点列，但我无法区分这些列？在 for filename in os.listdir(direc ...

2024-09-28 已阅读: n次