有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java如何在hadoop中获得像素rgb值?

我有数以百万计的图像存储在hadoop的hdfs中。我想建立这些图像的索引。如何获取这些图像的像素rgb值?我是hadoop新手,hadoop中的图像格式不同于原始的图像二进制格式。另一个问题是,为了提高效率,我应该使用hadoop中的sequencefile将巨大的图像打包到一个大文件中吗?非常感谢


共 (2) 个答案

  1. # 1 楼答案

    我可以部分地回答这个问题

    Another problem is should I use the sequencefile in hadoop to pack the enormous images to a big file for efficiency?

    取决于单个文件的大小。如果单个文件非常大,那么整合它们可能并没有真正的帮助,反之亦然

    查看此query以了解更多详细信息

  2. # 2 楼答案

    如果你有额外的存储空间,效率对你来说很重要,我肯定会选择SequenceFile。Hadoop将为您处理文件拆分。我们遇到了一个案例,我们从图像文件中提取数据,与您正在做的类似。在我们的例子中,我们提取元数据以便在发现系统中摄取,这样就可以在集群之外搜索我们的图像文件。在这种情况下,因为效率对我们来说不是什么大问题,所以我们只是单独处理文件,确保它们不可拆分。这样,另一个系统就可以通过http获取源文件