如何确认我的tensorflow模型恢复成功?下面是我在1000步之后从训练模型中得到的预测部分的代码。你知道吗 class vandys_speak(object): def __init__(self,session,input_mfcc, ...2024-05-20 已阅读: n次
当使用scikitlearn训练数据时,SVM多类分类停止我使用scikit&svm;将数据分为7类。数据是音频,我把它们分割成30毫秒的帧。 最后,有大约100万帧,每个帧作为一个标签样本使用13个mfcc特征。 当像下面的代码那样拟合数据时,我的cpu使 ...2024-05-20 已阅读: n次
用Knn算法处理音乐体裁,如何处理提取的特征? 我正在开发一个可以对音乐流派进行分类的工具。为此,我想使用K-nn算法(或者另一个算法,但是这个算法似乎足够好),并且我使用python-yaafe进行特征提取。在 我的问题是,当我从我的歌曲中提取 ...2024-05-20 已阅读: n次
名称错误:未定义全局名称“numpy”我试图通过收集essentia(MIR库)的函数来编写一个特性提取器。 流程图如下:单个特征提取,pool,PoolAggregator,使用np.concatenate从PoolAggregator ...2024-05-20 已阅读: n次
如何使hmmlearn算法适合MFCC数组?(Mel频率倒谱系数)hmmlearn.GaussianHMM.fit只需要序列我正在研究一个过去的kaggle竞赛问题,我正在写一个语音识别算法。在自动语音识别(ASR)算法中,通常将数据处理为MFCC(Mel频率倒谱系数)。在 使用jameslyons(https://git ...2024-05-20 已阅读: n次
TypeError:“module”对象不可调用。MFCC公司使用python处理基于说话人识别的项目,并在查找MFCC时获得以下错误。 Traceback (most recent call last): File "neh1.py", line 10, in ...2024-05-20 已阅读: n次
跳长、赢长、帧长、n\U fft、帧数之间的关系我正在使用mfcc功能 mfccs=librosa.feature.mfcc(y=y,sr=sr,n_-mfcc=12,n_-fft=320,hop_-length=320,htk=True) 在这里 ...2024-05-20 已阅读: n次
机器学习 - 如何处理Python的舍入误差?我正在使用Python将元素从音乐中分离出来。训练一个模型,我把我的音频分解成帧,每个帧都有一个标签-1或0。不幸的是,由于舍入错误,我的标签总是短1或2帧。你知道吗 将音频转换为帧,得到的值为(13 ...2024-05-20 已阅读: n次
基于Python的二维数组分类我正在尝试建立一个语音识别应用程序。到目前为止,我已经从10个示例语音中提取了mfcc特性。每个样品产生不同的形状,如下所示: (698,12) (414,12) (610,12) (586,12) ...2024-05-20 已阅读: n次
我的librosa MFCC输出正确吗?我想我在使用librosa MFCC时得到了错误的帧数result=librosa.feature.mfcc(signal, 16000, n_mfcc=13, n_fft=2048, hop_length=400) result.shape() 信号 ...2024-05-20 已阅读: n次
音频段对象与wave文件/d之间的转换我正在从mp3语音文件提取MFCC功能,但我确实想保持源文件不变,不添加任何新文件。我的处理包括以下步骤: 加载.mp3文件,消除静默,并使用pydub生成.wav数据 使用scipy.io.wav ...2024-05-20 已阅读: n次
Librosa Keras音乐分析神经网络Python:输入值E我最近尝试执行一个实验,使用Keras在pythonide中编写的神经网络来分析GTZAN歌曲数据集。我正在尝试改变图层,以查看是否对性能有任何影响。我的实验基于一篇特别的文章,详细描述了这个项目的基 ...2024-05-20 已阅读: n次
hotword_detection该库提供了使用mfcc特征和动态时间扭曲(dtw)模式匹配算法检测给定音频文件中的热词的功能。 安装 这个project is on pypi 从pypi安装: pip install hotwor ...2024-05-20 已阅读: n次