使用pyaudi时块、样本和框架是什么

import pyaudio import wave CHUNK = 1024 FORMAT = pyaudio.paInt16 CHANNELS = 2 RATE = 44100 RECORD_SECONDS = 5 WAVE_OUTPUT_FILENAME = "output.wav" p = pyaudio.PyAudio() stream = p.open(format=FORMAT, channels=CHANNELS, rate=RATE, input=True, frames_per_buffer=CHUNK) print("* recording") frames = [] for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)): data = stream.read(CHUNK) frames.append(data) print("* done recording") stream.stop_stream() stream.close() p.terminate()

play=pyaudio.PyAudio() stream_play=play.open(format=FORMAT, channels=CHANNELS, rate=RATE, output=True) for data in frames: stream_play.write(data) stream_play.stop_stream() stream_play.close() play.terminate()

1条回答

网友

1楼 · 发布于 2024-05-17 09:31:13

“RATE”是“采样率”，即每秒帧的数目
“CHUNK”是（任意选择的）帧数，在本例中，（可能很长）信号被分成
是的，每帧将有2个样本作为“CHANNELS=2”，但是术语“samples”很少用于此上下文（因为它很混乱）
是的，在本例中，每个样本的大小是2字节（=16位）
是的，每帧的大小是4字节
是的，“帧”的每个元素都应该是4096字节。sys.getsizeof()报告Python解释器所需的存储空间，通常比原始数据的实际大小大一点。
RATE * RECORD_SECONDS是应记录的帧数。由于for循环不是针对每个帧而重复，而是仅针对每个块，因此循环数必须除以块大小CHUNK。这与样本无关，因此不涉及2因素。
如果您真的想查看十六进制值，可以尝试[hex(x) for x in frames[0]]这样的方法。如果要获取实际的2字节数字，请使用格式字符串'<H'和struct模块。

您可能对我的关于使用wave模块读取WAV文件的教程感兴趣，该教程更详细地介绍了您的一些问题：http://nbviewer.jupyter.org/github/mgeier/python-audio/blob/master/audio-files/audio-files-with-wave.ipynb

相关问题更多 >

编程相关推荐

热门问题

热门文章