如何创建pairdd?

2024-09-29 01:30:01 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要创建一个PairRDD(draft\u id),其中key是项目的标识符,value是通过split方法获得的所有字段。我们有rdd草案

draft.take(3).foreach(println)

[Ljava.lang.String;@302bf7bb
[Ljava.lang.String;@3128929f
[Ljava.lang.String;@30037ad7

Tags: 项目方法keyidlangstringvalue标识符
1条回答
网友
1楼 · 发布于 2024-09-29 01:30:01

您需要调用mapToPair函数,该函数返回一个元组 例如,在python中:

def myMap2pair(element):
    key = element.getKey()
    value = element.getValue()
    return key, value

draftKV = draft.map(myMap2pair)

相关问题 更多 >