擅长:python、mysql、java
<p>这将处理整个数据集</p>
<pre><code>df.loc[1:5, 'enaging_user_following_count'].compute()
</code></pre>
<p>原因是,<code>loc</code>是一个基于标签的选择器,不知道在哪个分区中存在哪些标签(没有理由它们应该单调递增)。在索引格式良好的情况下,可能会有<code>df.divisions</code>的有用值,在这种情况下,Dask应该只能选择所需的数据分区</p>