hadoop中用于输入拆分的java自定义输入格式
我是否能够将整个input split
输入到映射器中,而不是将每行输入拆分到映射器中
为此,我需要实现自己的自定义输入格式。
但是如果我在写WholeFileInputFormat
这是指映射程序获取整行还是整个输入拆分
NLineInputFormat解决了我的问题吗
你可以在下面搜索框中键入要查询的问题!
我是否能够将整个input split
输入到映射器中,而不是将每行输入拆分到映射器中
为此,我需要实现自己的自定义输入格式。
但是如果我在写WholeFileInputFormat
这是指映射程序获取整行还是整个输入拆分
NLineInputFormat解决了我的问题吗
# 1 楼答案
我不会为
NLineInputFormat
而烦恼。您可能并不总是知道N是什么,也不需要读取每个文件的输入格式来查找行字节偏移量来自here的
WholeFileInputFormat
(我假设您正在引用的是它)将把整个文件作为值传递给map
方法