在Python中如何从FFT中获取时间/频率

3条回答

网友

1楼 · 编辑于 2024-05-13 07:07:08

除了@Paul R的答案之外，scipy.signal.spectrogram是scipy's signal processing module中的spectrogram function。

上述链接的示例如下：

from scipy import signal
import matplotlib.pyplot as plt

# Generate a test signal, a 2 Vrms sine wave whose frequency linearly
# changes with time from 1kHz to 2kHz, corrupted by 0.001 V**2/Hz of
# white noise sampled at 10 kHz.

fs = 10e3
N = 1e5
amp = 2 * np.sqrt(2)
noise_power = 0.001 * fs / 2
time = np.arange(N) / fs
freq = np.linspace(1e3, 2e3, N)
x = amp * np.sin(2*np.pi*freq*time)
x += np.random.normal(scale=np.sqrt(noise_power), size=time.shape)


#Compute and plot the spectrogram.

f, t, Sxx = signal.spectrogram(x, fs)
plt.pcolormesh(t, f, Sxx)
plt.ylabel('Frequency [Hz]')
plt.xlabel('Time [sec]')
plt.show()

网友

2楼 · 编辑于 2024-05-13 07:07:08

编辑：哦，看来这会返回值，但它们根本不适合音频文件。即使它们可以用作谱图上的幅度，但它们在那些经典的音频可视化工具中是不起作用的，例如在许多音乐播放器中都可以看到。我也试过用matplotlib的pylab做谱图，但结果是一样的。

import os
import wave
import pylab
import math
from numpy import amax
from numpy import amin

def get_wav_info(wav_file,mi,mx):
    wav = wave.open(wav_file, 'r')
    frames = wav.readframes(-1)
    sound_info = pylab.fromstring(frames, 'Int16')
    frame_rate = wav.getframerate()
    wav.close()
    spectrum, freqs, t, im = pylab.specgram(sound_info, NFFT=1024, Fs=frame_rate)
    n = 0
    while n < 20:
        for index,power in enumerate(spectrum[n]):
            print("%s,%s,%s" % (n,int(round(t[index]*1000)),math.ceil(power*100)/100))
        n += 1

get_wav_info("wave.wav",1,20)

有什么可以在可视化中获得数据库的技巧吗？基本上，我们显然已经从上面的代码中得到了所需的一切，只是如何使它返回正常值？忽略mi和mx，因为这些只是调整数组中的值以适应mi..mx间隔-这将用于可视化。如果我是正确的，spectrum在这段代码中返回数组数组，数组中包含来自freqs数组的每个频率的振幅，这些振幅根据t数组准时出现，但是值是如何工作的-如果返回这些奇怪的值，它是否真的是振幅，如果是，如何将其转换为dBs例如。

我需要像音乐播放器那样的可视化工具的输出，但是它不应该实时工作，我只需要数据，但是值不适合wav文件。

编辑2:我注意到还有一个问题。对于90秒wav，t数组包含175.x之前的时间，考虑到frame_rate对于wav文件是正确的，这看起来非常奇怪。所以现在我们有两个问题：spectrum似乎没有返回正确的值（如果我们得到正确的时间，它可能会适合），而t似乎返回了wav的两倍时间。

已修复：案例完全解决。

import os
import pylab
import math
from numpy import amax
from numpy import amin
from scipy.io import wavfile
frame_rate, snd = wavfile.read(wav_file)
sound_info = snd[:,0]
spectrum, freqs, t, im = pylab.specgram(sound_info,NFFT=1024,Fs=frame_rate,noverlap=5,mode='magnitude')

Specgram需要稍加调整，我只加载了一个scipy.io库（而不是wave库）通道。同样，如果没有将mode设置为magnitude，它将返回10log10而不是20log10，这就是它没有返回正确值的原因。

网友

3楼 · 编辑于 2024-05-13 07:07:08

看起来您正在尝试实现一个spectrogram，这是一个功率谱估计序列，通常由一系列（通常是重叠的）fft实现。因为你只有一个FFT（频谱），所以你还没有时间维度。将FFT代码放在一个循环中，每次迭代处理一个样本块（例如1024个），连续块之间有50%的重叠。生成的光谱序列将是时间v频率v幅度的3D阵列。

我不是一个Python人，但是我可以给你一些伪代码，这些代码应该足以让你编码：

N = length of data input
N_FFT = no of samples per block (== FFT size, e.g. 1024)
i = 0 ;; i = index of spectrum within 3D output array
for block_start = 0 to N - block_start
    block_end = block_start + N_FFT
    get samples from block_start .. block_end
    apply window function to block (e.g. Hamming)
    apply FFT to windowed block
    calculate magnitude spectrum (20 * log10( re*re + im*im ))
    store spectrum in output array at index i
    block_start += N_FFT / 2            ;; NB: 50% overlap
    i++
 end

相关问题更多 >

编程相关推荐

热门问题

热门文章