所以这里的想法是:你可以用短时傅立叶变换(stft)从音频文件中生成一个频谱图。然后some people生成了一个称为“二进制掩模”的东西,以从逆stft生成不同的音频(即去除背景噪声等)。你知道吗
以下是我的理解:
一旦我做了矩阵乘法,新的音频文件是如何创建的?
虽然不多,但我的代码如下:
from librosa import load
from librosa.core import stft, istft
y, sample_rate = load('1.wav')
spectrum = stft(y)
back_y = istft(spectrum)
谢谢,还有here一些幻灯片让我走了这么远。如果您能给我一个python示例/演示,我将不胜感激
目前没有回答
相关问题 更多 >
编程相关推荐