我正在运行hadoop流式处理命令:
/home/hduser/hadoop/bin/hadoop jar
/home/hduser/hadoop/share/hadoop/tools/lib
/hadoop-*streaming*.jar
-file audio.py
-cacheArchive hdfs://localhost:54310/user/hduser
/input/audio/cacheaudiodir.jar#cacheaudiodir
-input /user/hduser/input/audio -output /user/hduser/output
-mapper audio.py -cmdenv AUDIO_DIR=cacheaudiodir
当我试图在Python映射器中引用'cacheaudiodir'时,我得到一个错误:No such file or directory
,例如:
如何指向这个符号链接文件夹中的文件?在
看起来cachearchive是本地未注册的,而不是hdfs中的,所以“hadoop fs-ls”找不到任何内容,而“ls”却找不到。在
相关问题 更多 >
编程相关推荐