如何从大量的wav文件中使用tensorflow.data.Dataset API创建数据集？问题的回答

如何从大量的wav文件中使用tensorflow.data.Dataset API创建数据集？

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我有8742个wav文件（大约7.1GB），希望将原始数据放入<code>tf.data.<a href="https://www.cnpython.com/pypi/dataset" class="inner-link">dataset</a></code>。在 我的第一次尝试在下面。请注意，我使用了<code>soundfile</code>包，因为wav文件有不同的比特率，有些是每个样本24位的。据我所知，许多软件包不支持24位wav文件。在 <pre><code>import tensorflow as tf import soundfile filepaths = tf.gfile.Glob('michael/dataset/wav_filepaths/*.wav') #Get the files into a list labels = get_labels #pseudo function to obtain corresponding labels to audio raw_audio = [] #List to hold raw audio lists. These are 2 channel wavs so this will be a 3D list #Create a list were each element is raw audio data for f in filepaths: try: data, sample_rate = soundfile.read(f) #2 channels raw_audio.<a href="https://www.cnpython.com/list/append" class="inner-link">append</a>(data.tolist()) except Exception as err: #Poor practice to catch all exceptions like this but it is just an example print ('Exception') print (f) training_set = tf.data.Dataset.from_tensor_slices((raw_audio, labels)) </code></pre> 这个解决方案的问题是它的速度非常慢，因为soundfile读取所有原始数据并将其全部存储在一个列表中。在 我现在正在考虑一个解决方案，我首先将文件名和相应的标签存储在<code>tf.data.Dataset</code>中。然后我将创建一个映射函数，该函数调用<code>soundfile.read</code>，甚至可能在函数中使用<code>tensorflow.contrib.framework.python.ops.audio_ops</code>，只返回原始音频和相应的标签。该函数将使用<code>tf.data.Dataset.map</code>函数调用，以便整个过程成为图形的一部分并被并行化。在 我对所提出的解决方案的第一个顾虑是，它并不理想，而且在数据集中存储文件名，以便稍后用相应的数据替换，这似乎有点“老土”。我的第二个问题是我使用的GPU（1080Ti，11GB内存）可能会耗尽内存。在 请提供一个更好的方法（尤其是它应该更快）将原始音频数据从一个大的wav文件集中到<code>tf.data.Dataset</code>。在

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

如何从大量的wav文件中使用tensorflow.data.Dataset API创建数据集？

1 个回答

相关Python问题