wav2vec 2.0印地语/印度语自我监督学习教程?(Python)

2024-06-16 19:34:29 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我正在为印地语(印度次大陆的语言)音频进行语音到文本的项目。 在Facebook发布的wav2vec上看到了这篇精彩的文章

我能够使用前面提到的预训练模型运行这个版本。 然而,正如预期的那样,这对于非英语语言不会产生好的结果

然后我遇到了这个repo,它实现了越南语的半监督学习位。不幸的是,这一点对我来说真的很难复制

我也找不到任何其他为非英语语言实现wav2vec的资源

-有谁能帮我找到一个实现了半监督部分的博客/资源(最好是用python和windows操作系统实现的)?

-或者,是否有其他类似Python的新语音到文本库/模型/API提供印度语言支持(不包括Google的语音到文本API)

提前谢谢


Tags: 项目模型文本版本api语言facebook文章