filemerge:合并小hdfs文件的工具

filemerge的Python项目详细描述


文件合并

filemerge是一个实用程序,用于将大量小hdfs文件合并到 较小数量的大文件。filemerge用于hadoop操作 工程师和Map Reduce应用程序开发人员。

代码的结构很简单。实际的合并是由pig执行的 使用用户提供的参数在运行时创建的脚本。这些参数 控制要合并的文件集。该实用程序由单个文件组成, filemerge.py ,它接受输入参数并调用创建的pig 脚本。因此, pig 命令必须可用,并位于 运行时用户。 用户指定输入路径、输出路径、主题和 要合并为年/月/日格式或特定hdfs目录的文件 或文件中hdfs目录的列表。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
乐高EV3无法跟随LeJOS Java的直线   java防止内存映射文件变得过大   java Jax WS wsgen抛出ModelerException:找不到Web服务终结点   java如何在工作结束后处理进度条   输入流中的java无限循环   java将我的应用程序连接到在线MySQL服务器(工作台)   java在jsp中执行Javascript之前从服务器获取值   java如何使用javax swing在测验后显示分数?   java无法在GateIn门户中的IE上提交请求   使用加密时java CRC检查是否冗余?   java Android:如何捕捉这个异常   JavaAWS系统的等价物。出来println()?   JavaSpring,如何使用WebSocket向连接的客户端广播消息?   java Hibernate使用GenerationType在重启时复制主键。桌子