我可以使用什么技术来编写基于鼓点音频信号的识别程序?

2024-09-29 22:36:58 发布

您现在位置:Python中文网/ 问答频道 /正文

如问题标题所述-我可以使用什么技术来编写基于鼓型音频信号的识别程序?我想创建一个工具,作为一名鼓手音乐家,我可以从唱片中转录出鼓的一部分。我认为这是一种类似于语音记录的技术,但它是专门为以前在某种鼓模式库中定义的鼓模式而开发的。 问题是我是一个编程新手。半年来,我对微控制器的基本C++感兴趣,甚至不喜欢OOP。目前我正在试用python,这是我最后的编程知识/经验背景。现在,由于IT方面的知识水平很低,我真的不知道我应该对这种项目感兴趣的是什么技术、框架等。很明显,我应该寻找语音识别技术并学习这些技术,然后将这些知识应用于构建我自己的程序,但我不确定从哪里开始,我是否准备好阅读专业开源项目代码的厚墙。也许有某种友好的python框架可以让我开始讨论这个话题?我在研究中发现了PythonLibrosa框架,但它似乎非常先进,而且我应该学习信号理论才能熟练地使用它。让我知道你的想法,你认为我应该采取什么样的策略


Tags: 工具项目程序框架标题信号编程模式
1条回答
网友
1楼 · 发布于 2024-09-29 22:36:58

将音乐从音频自动转录成音符(通常为MIDI)的任务在研究界称为自动音乐转录。仅在鼓上进行的专门任务称为自动鼓转录(ADT)

ADT被广泛研究,开源和商业解决方案都可用。一个开源软件可以在ADTLib中找到。它提供了一个非常简单的pythonapi,它接受一个WAV文件并返回转录的鼓点轨迹。自述文件中链接了一些文章,描述了它们是如何组合在一起的。 一个名为ADTWeb的基于网络的工具允许在不安装任何软件的情况下尝试转录鼓

注意,ADT通常假定输入仅为/主要为鼓。如果你想从包含其他乐器的混合歌曲中提取鼓形图案,你可能还需要某种源分离步骤

相关问题 更多 >

    热门问题