基本hadoop mapreduce作业正在启动，但尚未完成

2013-03-29 2:30 miami cup 2.43 visa 2013-04-23 1:34 miami cup 2.43 visa 2013-04-23 10:15 LA spoon 1.32 visa 2013-04-28 6:34 LA bottle 3.56 cash 2013-05-23 1:43 miami glass 3.21 visa

import sys def mapper(): for line in sys.stdin: tempdata = line.strip().split("\n") for l in tempdata: if (len(l.split("\t")) == 6): date, time, store, item, cost, payment = l.split("\t") print("{0}\t{1}".format(store,cost)) def main(): mapper() if __name__=="__main__": main()

import sys def reducer(): salesTotal = 0 oldKey = None for line in sys.stdin: data = line.strip().split("\t") if len(data)!=2: continue thisKey, thisSale = data if oldKey and oldKey != thisKey: print("{0}\t{1}".format(oldKey,salesTotal)) salesTotal=0 oldKey = thisKey salesTotal+=float(thisSale) if oldKey != None: print("{0}\t{1}".format(oldKey,salesTotal)) def main(): reducer() if __name__=="__main__": main()

Tophers-Retina-MBP:lib tkessler$ hadoop jar ./hadoop-streaming-2.7.1.jar -mapper ~/PycharmProjects/Hadoop/mapper.py -reducer ~/PycharmProjects/Hadoop/reducer.py -file ~/PycharmProjects/Hadoop/mapper.py -input /data -output /project1out packageJobJar: [/Users/tkessler/PycharmProjects/Hadoop/mapper.py, /var/folders/f_/3zvmc1g95lqgt1cp2dtnrtqw0000gp/T/hadoop-unjar2355518779286421017/] [] /var/folders/f_/3zvmc1g95lqgt1cp2dtnrtqw0000gp/T/streamjob8766144507660069606.jar tmpDir=null

Tophers-Retina-MBP:~ tkessler$ hadoop jar /usr/local/Cellar/hadoop/2.7.1/libexec/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar pi 4 1000 Number of Maps = 4 Samples per Map = 1000 Wrote input for Map #0 Wrote input for Map #1 Wrote input for Map #2 Wrote input for Map #3 Starting Job

1条回答

网友

1楼 · 发布于 2024-09-26 18:08:27

通过关闭namenode和datanodes清除Hadoop，然后使用brew uninstall hadoop卸载它，然后按照本页上的说明进行设置：http://amodernstory.com/2014/09/23/installing-hadoop-on-mac-osx-yosemite/

现在似乎工作得很好，所以可能只是对配置做了一点小小的更改（可能是临时文件位置），但它现在处理映射器和reducer非常好。在

相关问题更多 >

编程相关推荐

热门问题

热门文章