我需要使用PySpark来展开以下包含嵌套dict的RDD,示例如下:
x = [{1: {345: 2}, 2: {33: 9}}, {5: {3: 2}, 2: {45, 9}}, {2: {33:5}}]
在我所掌握的实际数据中,每个嵌套dict的长度和项数可能不同。x
只是结构的代表。在
我需要输出为一个字典,其中键和值根据需要进行合并:
^{pr2}$
我怎样才能做到这一点?我试着把RDD弄平,但我搞不懂。我知道我必须以同样的方式使用combine和reduceByKey。在
这与处理元组和列表的链接问题不同。在
Tags:
相关问题 更多 >
编程相关推荐