擅长:python、mysql、java
<p>使用密集等级,它将给出相同等级的情况下,领带和下一个等级将不会被跳过
ntile函数将每个分区中的记录组拆分为n个部分。你的情况是哪一个是10</p>
<pre class="lang-py prettyprint-override"><code>from pyspark.sql.functions import dense_rank
spendWindow = Window.partitionBy('customer_id').orderBy(col('expenditure').asc())
aud_baskets = aud_baskets_ranks.withColumn('basket_rank',dense_rank.over(spendWindow))
</code></pre>