Audiomate是一个用于处理音频数据集的库。
audiomate的Python项目详细描述
音频伴侣
Audiomate是一个易于访问音频数据集的库。 它提供了以通用方式访问/加载不同数据集的数据结构。 这将简化音频数据集的使用,例如用于机器学习任务。
importaudiomatefromaudiomate.corpusimportio# Download a datasetesc_downloader=io.ESC50Downloader()esc_downloader.download('/local/path')# Load and work with the datasetesc50=audiomate.Corpus.load('/local/path',reader='esc-50')# e.g. Read the audio signal and the label of specific sample/utteranceutterance=esc50.utterances['1-100032-A-0']samples=utterance.read_samples()label=utterance.label_lists[audiomate.corpus.LL_SOUND_CLASS][0].value
此外,它还提供了与数据集交互的工具 (验证、拆分、子集、合并、筛选)、提取特征, 为训练ml模型和更多模型提供样本。
当前支持的数据集:
- Acoustic Event Dataset
- AudioMNIST
- Mozilla Common Voice
- ESC-50
- Free Spoken Digit Dataset
- German Distant Speech Corpus
- Google Speech Commands
- GTZAN
- M-AILABS Speech Dataset
- MUSAN
- LITIS Rouen Audio scene dataset
- Tatoeba
- TIMIT
- Urbansound8k
- Voxforge
当前支持的格式:
间接支持的数据集(Details):
安装
pip install audiomate
安装最新的开发版本:
pip install git+https://github.com/ynop/audiomate.git
开发
先决条件
建议在开发AudioMate时使用虚拟环境。 要创建一个,请在项目的根目录中执行以下命令:
python -m venv .
要安装AudioMate及其所有依赖项,请执行:
pip install -e .
运行测试套件
pip install -e .[dev]
python setup.py test
使用pycharm,您可能需要更改默认的测试运行程序。否则,它可能只建议使用鼻子。要执行此操作,请转到“文件”>;“设置”>;“工具”>;“Python集成工具”(在Mac电脑上是PyCharm>;“首选项”>;“设置”>;“工具”>;“Python集成工具”),并将测试运行程序更改为py.test。
基准
为了检查特定部件的运行时,使用pytest-benchmark
。基准测试是正常的测试函数,但是要调用测试代码的基准测试夹具。
运行基准:
# Run all
pytest bench
# Specific benchmark
pytest bench/corpus/test_merge_corpus.py
要比较不同的运行:
pytest-benchmark compare
编辑文档
文档是用reStructuredText编写的,并在Sphinx的帮助下转换为各种输出格式。
要生成文档,请执行:
pip install -e .[dev]
cd docs
make html
生成的文件将写入docs/_build/html
。
版本
使用bump2version处理版本。要提升版本:
bump2version [major,minor,patch,release,num]