擅长:python、mysql、java
<p>使用二级排序对用户id进行排序。这样,您就不需要在内存中存储任何东西——只需将数据流传送,每次看到特定站点id的值更改时,都会增加不同的计数器</p>
<p>这是一些<a href="http://hadoop.apache.org/docs/r0.19.1/streaming.html#A+Useful+Partitioner+Class+%28secondary+sort%2C+the+-partitioner+org.apache.hadoop.mapred.lib.KeyFieldBasedPartitioner+option%29" rel="nofollow noreferrer">documentation</a>。</p>