从频谱图时频序列阵列获取MFCC

2024-09-25 18:20:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我有几个spectrogra时间/频率[5001024]文件。你知道吗

我需要计算这些文件的MFCC。有很多库用于在原始音频文件上计算MFCC,但我正在python中寻找一种方法,用于直接从np.数组. 你知道吗


Tags: 文件方法np时间数组音频文件频率mfcc
1条回答
网友
1楼 · 发布于 2024-09-25 18:20:06

这可以通过librosa实现,因为它允许使用参数S传入频谱图而不是音频波形。你知道吗

我假设你有一个STFT幅度谱图(相位丢弃的线性谱图)。然后需要将其转换成mel滤波的谱图,进行对数缩放,然后进行DCT-2和截断以获得MFCC系数。骨架代码如下:

import librosa
import numpy

# TODO: you need to provide these
sr = my_samplerate
my_stft

mels = librosa.feature.melspectrogram(S=my_stft, sr=sr, n_mels=64)
log_mels = librosa.core.amplitude_to_db(mels, ref=numpy.max)
mfcc = librosa.feature.mfcc(S=log_mels, sr=sr, n_mfcc=20)

有关详细信息,请参见librosa API reference。你知道吗

相关问题 更多 >