擅长:python、mysql、java
<p>半年前我就玩过这个了<code>.head()</code>不检查所有分区,只检查第一个分区。没有同步开销等,所以它相当快,但它没有考虑到整个数据集</p>
<p>你可以试试</p>
<pre><code>df.loc[-251: , 'enaging_user_following_count'].head(250)
</code></pre>
<p>IIRC您应该获得第一个分区的最后250个条目,而不是实际的最后索引</p>
<p>如果你尝试类似的东西</p>
<pre><code>df.loc[conditionThatIsOnlyFulfilledOnPartition3 , 'enaging_user_following_count'].head(250)
</code></pre>
<p>您得到的错误是head找不到250个样本</p>
<p>如果您实际上只想要前几个条目,那么它非常快:)</p>