擅长:python、mysql、java
<p>看起来您已经成功创建了dask数据帧。如果您希望看到类似熊猫数据帧的内容,那么可以使用<code>dataset.head()</code>查看数据。对于更复杂的计算,最好保持数据集惰性(作为dask数据帧),并对所有转换使用标准的<code>pandas</code>语法</p>
<pre><code># this is needed to call dask.compute
import dask
# for example take a subset
subset_data = dataset[dataset['year']>2000]
# find out the total value for this column
lazy_result = subset_data['individualCount'].sum()
# now that the target is known use .compute
computed_result = dask.compute(lazy_result)
</code></pre>
<p>除了dask之外,您还可以查看<code>vaex</code>,出于某些目的,它可能更好:<a href="https://vaex.io/" rel="nofollow noreferrer">https://vaex.io/</a></p>