擅长:python、mysql、java
<p>如果你想使用timeseries,我认为使用块不是一个正确的方法。你应该使用groupby,然后应用你喜欢的分析。在熊猫/达斯克基本上是一样的。假设您只想知道每个sku的商店数量</p>
<pre class="lang-py prettyprint-override"><code>import dask.dataframe as dd
import pandas as pd
df = dd.read_csv("file.csv")
out = df.groupby('SKU')["STORE"].nunique().compute()
</code></pre>