我先做一个小的介绍-只是为了让你知道我想法的背景:)
我正在学习MIR,我想用深度学习来操作midi文件。 我的想法包括记录数据-所以它必须是mp3/wav输入数据。在
经过大量的研究和思考,我想我将建立基于midi输入和输出的神经网络。在
好的..那么..让我们继续讨论这个问题: 我需要把mp3文件转换成midi文件。在
我(在朋友们的帮助下:D)想的是用LSTM自动编码器进行序列到序列的学习, nn将得到一个mp3输入和midi输出,经过一些迭代,它应该找到最好的特性来进行转换,并且使用该模型,我将转换从我的程序中录制的声音文件,这样我可以从他们的midi文件中学习。在
这个解决方案的问题(对我来说)是在每个媒体文件的numpy数组之间同步。在
我需要给网络每个媒体相同的时间戳,以便它可以学习它们之间的转换。在
抱歉,我没有告诉你,我正在使用python和keras。在
非常感谢帮手们!! 祝你有美好的一天!:)
目前没有回答
相关问题 更多 >
编程相关推荐