java Hadoop map减少总客户数量
我很难使用Hadoop map reduce计算两个值之间的ToClient之和
例如,我想计算[1, 15000]
的toClient之和。
但据我所知,map reduce处理的数据有一些共同点(标签)
我设法理解了该数据的模式:
doctor 23
doodle 34
doctor 2
doodle 5
这些是一个单词在给定文本中的出现
使用map reduce将链接给定单词的值,如下所示:
doctor [(23 2)]
doodle [(34 5)]
然后计算这些值的和
但是对于一个总额,我们从来没有像上面例子中的绳子这样的共同点。鉴于该数据集:
DS1: 1 2 3 4 5 ..... 15000
是否可以使用map reduce架构计算列表中所有ToClient的总和
# 1 楼答案
如果文本文件中有数字,用空格分隔,则可以在映射器中拆分它们并求和,如下所示:
制图员:
作业控制:
感谢@cricket_007的建议