MapReduce对处理大文件、抓取大量页面以获取数据并将其插入Hbase有用吗？

parse 1000 text files (gziped) : ~ 100 GB 30 Millions rows Crawl some data from many websites : 40 Millions rows Script distributed in 50 Amazon EC2 micro instances (5 scripts / instance)

1条回答

网友

1楼 · 发布于 2024-10-05 12:16:51

MapReduce是由不同的分销商（Apache、Google等）实现的编程范式。如果您想使用MapReduce处理数据，您需要配置集群并将数据存储在分布式文件系统（hdfs或Hadoop已知的其他实现）中。是的，mapreduce作业将在集群中的不同节点之间进行并行处理，从而节省您的时间。你知道吗

编程相关推荐

java日期格式的月和日的固定长度？
无法将java ArrayList<String>转换为字符串。
java当我使用log4j 1.2.15时，编译时出现错误；当更改为1.2.16时，一切正常
java如何使用ArgumentMatchers将任何队列告知Mockito？
如何解决“java”。Java电子邮件API中的lang.ExceptionInInitializerError
java是实例化对象名并设置其值的通用方法
java在多线程环境中，如果一个线程崩溃，如何关闭JVM？
java WebDriverManager在selenium中获取不正确版本的驱动程序
如果JAVA中后减量的优先级高于前增量，那么为什么下面的代码输出为22.0而不是20.0。？
在hibernate中找不到java属性

相关问题更多 >

编程相关推荐

热门问题

热门文章

MapReduce对处理大文件、抓取大量页面以获取数据并将其插入Hbase有用吗？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >