鲍勃的音频处理实用程序
bob.ap的Python项目详细描述
Bob的音频处理
这个包是信号处理和机器学习工具箱的一部分 Bob。它包含基本的音频处理实用程序。目前,以下基于倒谱的功能可用: 使用矩形(RFCC)、MEL缩放三角形(MFCC)[Davis1980]、反转MEL缩放三角形(IMFCC)。 线性三角(LFCC)滤波器[Furui1981],基于光谱通量的特征(SSFC)[Scheirer1997], 子带质心频率(scfc)[Le2011]。我们计划在 不久的将来。
请注意,与包的早期版本相比,mfcc和lfcc功能的实现已经更改, 因为我们修正了预加重和dct计算。delta和delta的计算也略有改变。
接触
有关此软件包的问题或报告问题,请与我们的 开发mailing list。
[Davis1980] | S. Davis and P. Mermelstein, “Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences”, in IEEE Transactions on Acoustics, Speech, and Signal Processing, 1980, num 4, vol. 28, pages 357-366. |
[Furui1981] | S. Furui, Cepstral analysis technique for automatic speaker verification, in IEEE Transactions on Acoustics, Speech, and Signal Processing, 1981, num 2 vol 29, pages 254-272. |
[Scheirer1997] | E. Scheirer and M. Slaney, Construction and evaluation of a robust multifeature speech/music discriminator, in IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP, 1997, vol 2, pages 1331-1334. |
[Le2011] | P. N. Le, E. Ambikairajah, J. Epps, V. Sethu, E. H. C. Choi, Investigation of Spectral Centroid Features for Cognitive Load Classification, in Speech Commun., April, 2011, num 4, vol 53, pages 540–551. |