犀牛语音内容引擎。
pvrhino的Python项目详细描述
Rhino语音到意图引擎
加拿大温哥华制造
Rhino是Picovoice的语音对意图引擎。它直接从给定上下文中的口头命令推断出意图 实时感兴趣。例如,给出一个口头命令“我能喝一杯加了很多糖的小双倍浓缩咖啡吗 而一些牛奶“,Rhino推断用户想要订购一种具有以下规格的饮料:
{"type":"espresso","size":"small","numberOfShots":"2","sugar":"a lot","milk":"some"}
犀牛是:
- 使用在现实环境中训练的深层神经网络。在
- 紧凑且计算效率高,非常适合物联网。在
- 自助服务。开发人员和设计师可以使用Picovoice Console训练自定义模型。在
兼容性
- Python3
- 可在Linux(x86_64)、Mac(x86_64)、Windows(x86_64)、Raspberry Pi(所有变体)和BeagleBone上运行。在
安装
^{pr2}$使用
创建引擎实例:
importpvrhinohandle=pvrhino.create(context_path='/absolute/path/to/context')
{cd1>在其中创建指向上下文的路径 Picovoice Console或Rhino的GitHub存储库上可用的默认上下文之一。在
可以使用sensitivity
参数调整引擎的灵敏度。它是一个浮点数
[0,1]。较高的灵敏度值会导致较少的失误,代价是(潜在地)增加错误
推断率。在
importpvrhinohandle=pvrhino.create(context_path='/absolute/path/to/context',sensitivity=0.25)
初始化时,有效采样率由handle.sample_rate
给出。预期帧长度(音频样本数
在输入数组中)是handle.frame_length
。引擎接受16位线性编码的PCM并在
单声道音频。在
defget_next_audio_frame():passwhileTrue:is_finalized=rhino.process(get_next_audio_frame())ifis_finalized:inference=rhino.get_inference()ifnotinference.is_understood:# add code to handle unsupported commandspasselse:intent=inference.intentslots=inference.slots# add code to take action based on inferred intent and slot values
完成后,必须明确释放资源:
handle.delete()
演示
pvrhinodemo提供用于实时处理的命令行实用程序 使用Rhino的音频(即麦克风)和文件。在
- 项目
标签: