擅长:python、mysql、java
<p>让我们先生成一些数据</p>
<pre><code>N = 1000
y1 = np.random.randn(N)
y2 = y1 + np.random.randn(N) * 0.05
y2[0:int(N / 10)] = 0
</code></pre>
<p>在这些数据中,<code>y1</code>和<code>y2</code>几乎是相同的(注意添加的小噪声),但是{<cd2>}的前10%是空的(类似于您的示例)</p>
<p>我们现在可以计算两个向量之间的绝对差,并找到第一个绝对差值低于灵敏度阈值的元素:</p>
^{pr2}$
<p><img src="https://i.stack.imgur.com/Wm650.png" alt="sample data plotted"/></p>
<p>如果重叠部分确实“几乎完全相同”,则此方法有效。如果相似度较低,您将不得不考虑更聪明的对齐方式。在</p>