擅长:python、mysql、java
<p>据我所知,振幅是记录时大气压力变化的测量值。根据<code>librosa.load</code>文档<a href="https://librosa.org/doc/latest/generated/librosa.load.html#librosa.load" rel="nofollow noreferrer">here</a>,此方法返回两件事:</p>
<ul>
<li><p>采样率<code>sr</code>:这意味着每秒记录多少个样本</p>
</li>
<li><p>二维阵列:</p>
<ul>
<li><strong>第一个轴</strong>:表示音频中振幅(气压变化)的记录样本</李>
<li><strong>第二个轴</strong>:表示音频中的频道数</李>
</ul>
</li>
</ul>
<p>以下是官方文件中的一个示例:</p>
<pre><code>>>> import librosa
>>> filename = librosa.util.example_audio_file()
>>> y, sr = librosa.load(filename)
>>> sr #sample rate
22050
>>> y.shape #mono (1 channel)
(1355168,)
>> y.shape[0] / sr #duration of audio file in seconds
61.45886621315193
</code></pre>
<p>我们可以看到:</p>
<ul>
<li>采样率为<code>22050</code>,这意味着记录器每秒记录<code>22050</code>次</李>
<li><code>y.shape = (1355168,)</code>,这意味着整个音频中只有一个通道(单声道)记录了<code>1355168</code>个样本</李>
<li>使用简单的数学,您可以通过将<code>total_number_of_samples</code>除以<code>sample_rate</code>来计算此音频文件的持续时间</li>
</ul>