java使用Hadoop连接两个需要两个映射和一个reduce的数据集

1 周，1 日 Questions & Answers 250

Possible Duplicate:
Equivalent of mongo's out:reduce option in hadoop

我有两个数据集，一个是另一个的补充。它看起来像这样（不是实际字段）：

Question
========
id(key)
name
description

Answer
========
id(key)
type
question_id

Output
======
question_id (key)
name
description
type_a_count
type_b_count

我想知道每个问题有多少个特定类型的答案。我以前使用mongodb的map reduce引擎来实现这一点，除了type_count字段中的一个字段外，我的问题映射器会发出相同的字段（但已归零），然后在我的reducer中添加所有内容 现在的问题是，当我运行答案映射器时，来自问题映射器的值被来自答案映射器的值覆盖

我正在寻找mongodb的{out:“reduce”}选项的等价物

Python中文网

有 Java 编程相关的问题?

java使用Hadoop连接两个需要两个映射和一个reduce的数据集

更多详情：

共 (1) 个答案

# 1 楼答案