如何创建新的语言模型NLP?python

2024-10-02 22:31:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我最近使用GoogleAPI用识别器类将一些音频文件转录成文本。 我发现可用的语言数量有限,最常用和国际通用的是其中的一部分。。。 我想知道我是否能从自定义词汇中得到一些关于开发一种新语言的提示,尝试实现一种本地语言(Lingala)并能够转录它。 如果它可以是令牌的定义 训练文本数据集等

目标:

  • 用词汇创造一种新的语言&;训练它
  • 将该语言用作音频输入的识别器

注意:我进行了多次搜索,但似乎没有得到我需要的确切答案。。。 我在用Python


Tags: 数据答案文本语言目标数量定义音频