擅长:python、mysql、java
<p>虽然理论上可以用<a href="https://www.tensorflow.org/api_docs/python/tf/read_file" rel="nofollow noreferrer">^{<cd1>}</a>读取文件,并用<a href="https://www.tensorflow.org/api_docs/python/tf/contrib/ffmpeg/decode_audio" rel="nofollow noreferrer">^{<cd2>}</a>对其进行解码,但这种情况下通常的方法是将数据转换为TFRecord格式,然后用<a href="https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset" rel="nofollow noreferrer">^{<cd3>}</a>读取。<a href="http://www.machinelearninguru.com/deep_learning/tensorflow/basics/tfrecord/tfrecord.html" rel="nofollow noreferrer">This blog post</a>显示了一个如何做到这一点的示例,在您的例子中,您需要一个脚本来读取每个WAV文件,对其进行解码并在文件中写入样本向量(我认为32位值是最简单的方式)。注意,如果要将多个音频文件批处理为一个张量,要么它们的大小必须相同,要么必须使用<a href="https://www.tensorflow.org/api_docs/python/tf/data/Dataset#padded_batch" rel="nofollow noreferrer">^{<cd4>}</a>来形成适当的张量。在</p>