在python中将mp4声音转换为文本

import requests import speech_recognition as sr url = 'https://cdn.fbsbx.com/v/t59.3654-21/15720510_10211855778255994_5430581267814940672_n.mp4/audioclip-1484407992000-3392.mp4?oh=a78286aa96c9dea29e5d07854194801c&oe=587C3833' r = requests.get(url) with open("test.mp4", "wb") as handle: for data in r.iter_content(): handle.write(data) r = sr.Recognizer() with sr.AudioFile('test.mp4') as source: audio = r.record(source) command = r.recognize_google(audio) print command

Traceback (most recent call last): File "<stdin>", line 1, in <module> File "C:\Users\Asterios\Anaconda2\lib\site-packages\speech_recognition\__init__.py", line 200, in __enter__ self.audio_reader = aifc.open(aiff_file, "rb") File "C:\Users\Asterios\Anaconda2\lib\aifc.py", line 952, in open return Aifc_read(f) File "C:\Users\Asterios\Anaconda2\lib\aifc.py", line 347, in __init__ self.initfp(f) File "C:\Users\Asterios\Anaconda2\lib\aifc.py", line 298, in initfp chunk = Chunk(file) File "C:\Users\Asterios\Anaconda2\lib\chunk.py", line 63, in __init__ raise EOFError EOFError

2条回答

网友

1楼 · 编辑于 2024-05-19 20:53:57

最后我找到了解决办法。我把它贴在这里，以防将来对别人有帮助。

幸运的是，pythonanywhere.com预装了avconv（avconv类似于ffmpeg）。

下面是一些有效的代码：

import urllib2
import speech_recognition as sr
import subprocess
import os

url = 'https://cdn.fbsbx.com/v/t59.3654-21/15720510_10211855778255994_5430581267814940672_n.mp4/audioclip-1484407992000-3392.mp4?oh=a78286aa96c9dea29e5d07854194801c&oe=587C3833'
mp4file = urllib2.urlopen(url)

with open("test.mp4", "wb") as handle:
    handle.write(mp4file.read())

cmdline = ['avconv',
           '-i',
           'test.mp4',
           '-vn',
           '-f',
           'wav',
           'test.wav']
subprocess.call(cmdline)

r = sr.Recognizer()
with sr.AudioFile('test.wav') as source:
    audio = r.record(source)

command = r.recognize_google(audio)
print command

os.remove("test.mp4")
os.remove("test.wav")

在免费计划中，cdn.fbsbx.com不在pythonanywhere网站的白名单上，因此我无法用urllib2下载内容。我联系了他们，他们在1-2小时内将域名添加到白名单中！

因此，非常感谢和祝贺他们的出色服务，即使我使用免费层。

网友

2楼 · 编辑于 2024-05-19 20:53:57

使用Python视频转换器 https://github.com/senko/python-video-converter

import requests
import speech_recognition as sr
from converter import Converter

url = 'https://cdn.fbsbx.com/v/t59.3654-21/15720510_10211855778255994_5430581267814940672_n.mp4/audioclip-1484407992000-3392.mp4?oh=a78286aa96c9dea29e5d07854194801c&oe=587C3833'
r = requests.get(url)
c = Converter()

with open("/tmp/test.mp4", "wb") as handle:
for data in r.iter_content():
handle.write(data)

conv = c.convert('/tmp/test.mp4', '/tmp/test.wav', {
    'format': 'wav',
    'audio': {
    'codec': 'pcm',
    'samplerate': 44100,
    'channels': 2
    },
})

for timecode in conv:
    pass

r = sr.Recognizer()
with sr.AudioFile('/tmp/test.wav') as source:
audio = r.record(source)

command = r.recognize_google(audio)
print command

相关问题更多 >

编程相关推荐

热门问题

热门文章