我正在尝试使用PyAudio录制音频并对其执行FFT分析
根据格式(paInt8或paInt16),即使声源和录音设置相同,音频数据的大小(以下代码中的“已解码”)也会有所不同。我所说的幅度是指“解码”中值列表中的平均或最大幅度
import numpy as np
import os
import time
import pyaudio
import matplotlib.pyplot as plt
from scipy.fftpack import fft
CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 1
RATE = 44100
RECORD_SECONDS = 10
WAVE_OUTPUT_FILENAME = "test.wav"
p = pyaudio.PyAudio()
stream = p.open(format=FORMAT,
channels=CHANNELS,
rate=RATE,
input=True,
frames_per_buffer=CHUNK)
input('Press key to start recording:\n')
print('1 sec delay started') #delay so keystroke doesn't get recorded
time.sleep(1)
print("* recording")
frames = []
n = 1024
k=np.arange(n)
T = n/RATE
frq = k/T
frq = frq[range(int(n/2))] # one side frequency range
for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
data = stream.read(CHUNK)
frames.append(data)
decoded = np.fromstring(data, dtype=np.int16) #grab the data in stream
fft_decode=fft(decoded)/(len(decoded)/2) #normalized FFT
mags=np.absolute(fft(decoded)) #
plt.ylim(top=55000)
plt.xlabel('Freq (Hz)')
plt.ylabel('|Y(freq)|')
plt.plot(frq, mags[range(int(n/2))],'b')
plt.pause(.01)
plt.gcf().clear()
print("* done recording")
plt.close()
我想知道我是否做错了什么,或者这是意料之中的。我的假设是这是意料之中的。这就是为什么:
麦克风根据声压输出电压。麦克风电压被放大,放大后的电压进入ADC。放大器增益使得最大麦克风输出与ADC的最大输入电压相匹配。ADC将输入电压转换为一个数字,该数字的大小取决于位数。假设最大输入电压为5V,8位为255,16位为65535
当我使用PyAudio录制音频时,“decoded”由ADC输出的数字组成(是真的吗?),并且根据我使用的是8位还是16位编码而有所不同
请告知
目前没有回答
相关问题 更多 >
编程相关推荐