我尝试使用webrtcvad2.0.8进行语音活动检测。这个https://pypi.python.org/pypi/webrtcvad提供了基本过程。当我尝试如下实现它时,我得到了一个错误。 我的代码:
import webrtcvad
from scipy.io import wavfile
import scipy
source1 = path + "phone1.wav"
fs, audio = wavfile.read(source1)
audio_n = audio/float(2**15)
vad = webrtcvad.Vad(3)
def audioSlice(x, fs, framesz, hop):
framesamp = int(framesz*fs)
hopsamp = int(hop*fs)
X = scipy.array([x[i:i+framesamp] for i in range(0, len(x)-framesamp, hopsamp)])
return X
framesz=10./1000 #10 ms
hop = 1.0*framesz
Z = audioSlice(audio_n, fs, framesz, hop)
vad.is_speech(Z[100], fs)
我得到的错误是:
^{pr2}$
webrtcvad期望缓冲区是一个包含数据字节的字符串,而不是一个浮点数组。你可以做些像
相关问题 更多 >
编程相关推荐