音频记录的大小是否因数据类型而异?

2024-09-28 05:21:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用PyAudio录制音频并对其执行FFT分析

根据格式(paInt8或paInt16),即使声源和录音设置相同,音频数据的大小(以下代码中的“已解码”)也会有所不同。我所说的幅度是指“解码”中值列表中的平均或最大幅度

import numpy as np
import os
import time
import pyaudio
import matplotlib.pyplot as plt
from scipy.fftpack import fft

CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 1
RATE = 44100
RECORD_SECONDS = 10
WAVE_OUTPUT_FILENAME = "test.wav"

p = pyaudio.PyAudio()

stream = p.open(format=FORMAT,
                channels=CHANNELS,
                rate=RATE,
                input=True,
                frames_per_buffer=CHUNK)

input('Press key to start recording:\n')
print('1 sec delay started') #delay so keystroke doesn't get recorded
time.sleep(1)
print("* recording")


frames = []
n = 1024
k=np.arange(n)
T = n/RATE
frq = k/T
frq = frq[range(int(n/2))] # one side frequency range
for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
    data = stream.read(CHUNK)
    frames.append(data)
    decoded = np.fromstring(data, dtype=np.int16) #grab the data in stream
    fft_decode=fft(decoded)/(len(decoded)/2) #normalized FFT
    mags=np.absolute(fft(decoded)) #
    plt.ylim(top=55000)
    plt.xlabel('Freq (Hz)')
    plt.ylabel('|Y(freq)|')
    plt.plot(frq, mags[range(int(n/2))],'b')
    plt.pause(.01)
    plt.gcf().clear()

print("* done recording")

plt.close()

我想知道我是否做错了什么,或者这是意料之中的。我的假设是这是意料之中的。这就是为什么:

麦克风根据声压输出电压。麦克风电压被放大,放大后的电压进入ADC。放大器增益使得最大麦克风输出与ADC的最大输入电压相匹配。ADC将输入电压转换为一个数字,该数字的大小取决于位数。假设最大输入电压为5V,8位为255,16位为65535

当我使用PyAudio录制音频时,“decoded”由ADC输出的数字组成(是真的吗?),并且根据我使用的是8位还是16位编码而有所不同

请告知


Tags: importfftdataratenprangeplt音频

热门问题