有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

hadoop中用于输入拆分的java自定义输入格式

我是否能够将整个input split输入到映射器中,而不是将每行输入拆分到映射器中

为此,我需要实现自己的自定义输入格式。 但是如果我在写WholeFileInputFormat

这是指映射程序获取整行还是整个输入拆分

NLineInputFormat解决了我的问题吗


共 (1) 个答案

  1. # 1 楼答案

    我不会为NLineInputFormat而烦恼。您可能并不总是知道N是什么,也不需要读取每个文件的输入格式来查找行字节偏移量

    来自hereWholeFileInputFormat(我假设您正在引用的是它)将把整个文件作为值传递给map方法