擅长:python、mysql、java
<pre><code>df.sort_values(by='Distance').groupby('SourceID').agg('first')
</code></pre>
<p>您希望按距离对数据帧进行排序,并为每个<code>'SourceID'</code>获取距离最小的行,即每个组的第一行。你知道吗</p>
<p>上述操作产生以下输出:</p>
<pre><code> Index ComparedID Distance
SourceID
106 572 11 0.0000
107 574 84 0.0028
</code></pre>
<p>当您使用group by时,分组的列最终会被索引,您可以通过随后重置索引来展平数据帧,以获得所需的输出</p>
<pre><code>df.sort_values(by='Distance').groupby('SourceID').agg('first').reset_index()
</code></pre>
<p>输出:</p>
<pre><code> SourceID Index ComparedID Distance
0 106 572 11 0.0000
1 107 574 84 0.0028
</code></pre>