擅长:python、mysql、java
<p>好吧,我想你把它弄糊涂了。在</p>
<p>给定一个如下所示的数据帧:</p>
<pre><code> avgPrice productId startDtTime totalSold
0 42.5 A001 01/05/2018 100
1 55.5 A001 02/05/2018 150
2 48.5 A001 03/05/2018 300
3 42.5 A002 01/05/2018 220
4 53.5 A002 02/05/2018 250
</code></pre>
<p>我假设您对第2行和第4行(各自productId的最后一个值)感兴趣。在pandas中,最简单的方法是将<code>drop_duplicates()</code>与参数<code>keep='last'</code>一起使用。考虑这个例子:</p>
^{pr2}$
<p>你会得到:</p>
<pre><code> avgPrice productId startDtTime totalSold
2 48.5 A001 2018-03-05 300
4 53.5 A002 2018-02-05 250
</code></pre>