2024-09-30 22:26:18 发布
网友
在将一个大文件加载到RDD0之后,我创建(非常耗时)RDD1对
RDD0
RDD1
((k1,k2), value)
并应用reduceByKey。对于RRD0,我需要创建一个RDD2对
reduceByKey
RRD0
RDD2
它的创建同样耗时,并应用另一个reduceByKey。在
我可以创建RDD12对吗
RDD12
((k1,k2,k3), value)
然后先在(k1,k2)上应用reduceByKey,然后再在{}上应用{},这样我就节省了不创建{}和{}的时间?在
(k1,k2)
第一个操作应该是flatMap,然后返回
[((k1,k2), value1), ((k1,k3)), value2)]
然后运行reduceByKey,你就会得到你的结果
第一个操作应该是flatMap,然后返回
然后运行reduceByKey,你就会得到你的结果
相关问题 更多 >
编程相关推荐