如何产生音频(.wav)卡夫卡在一个消息

2024-06-28 19:54:00 发布

您现在位置:Python中文网/ 问答频道 /正文

为了使用大数据技术应用实时语音分析,我在开始时尝试使用卡夫卡。因此,首先我使用wavioapi将.wav文件转换为字节,然后将包含[data(nparray的类型)、rate(integer)和sampwidth(integer)]的消息发送给kafka,之后这些消息将被消费者使用,消费者将再次将其转换为.wav文件。你知道吗

问题是我如何在一条消息中向kafka发送和接收这些[数据、速率、sampwidth](每条消息代表.wav文件)?你知道吗

对于生产商:

    producer = KafkaProducer(bootstrap_servers='localhost:9092')
    x = wav2bytes("bush_read") # return tuple containing(data, rate, sampwidth)
    #here I'm sending 3 messages
    producer.send("TestTopic", key=b'data', value=b'%s' % (x[0])) # data -> nparray
    producer.send("TestTopic", key=b'rate', value=b'%d' % (x[1]))   # rate -> int
    producer.send("TestTopic", key=b'sampwidth', value=b'%d' % (x[2]))  #sampwidth -> int
    send("TestTopic","bush_read")

对于消费者:

    for message in consumer:
        msg = message     # I want somthing like this
        file = bytes2wav("name", msg.data, msg.rate, msg.sampwidth )

Tags: producer文件数据keysend消息datarate
2条回答

如果需要,可以将其作为json(或任何其他序列化)发送,创建一个类似json的

{'data' : data, 'rate': rate, 'sampwidth': sampwidth}

你可以在消费者中反序列化它

只是另一个想法!!你知道吗

如果.wav文件相当大,它可能会在代理上施加负载,这可能会减慢集群的速度。可以通过在完整的大文件旁边发布参考消息来避免。你知道吗

  1. 将大文件存储在外部存储的某些位置
  2. 将文件的元引用发布到指向存储文件位置的主题
  3. 使用者可以使用引用并将文件定位到外部存储器中。你知道吗

相关问题 更多 >