如何使用二进制掩码和STFT生成音频文件？

2024-10-04 03:27:25 发布

男 | 程序猿一只，喜欢编程写python代码。

所以这里的想法是：你可以用短时傅立叶变换（stft）从音频文件中生成一个频谱图。然后some people生成了一个称为“二进制掩模”的东西，以从逆stft生成不同的音频（即去除背景噪声等）。你知道吗

以下是我的理解：

一旦我做了矩阵乘法，新的音频文件是如何创建的？

虽然不多，但我的代码如下：

from librosa import load
from librosa.core import stft, istft
y, sample_rate = load('1.wav')
spectrum = stft(y)
back_y = istft(spectrum)

谢谢，还有here一些幻灯片让我走了这么远。如果您能给我一个python示例/演示，我将不胜感激

Tags： from import 信息二进制 load 矩阵 some people

0条回答

目前没有回答