在Python PySpark rdd中获取每个不同键的最大值和最小值的有效方法

2024-04-19 12:38:41 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我有一些像rdd这样的数据,带有键值对

rdd1. = [('a', 5), ('b', 6), ('c', 1), ('c', 5), ('a', 2), ('b', 8), ('c', 7), ('b', 9), ('a', 3)]

对于像这样的每个不同的键,用max和min返回这样的内容最有效的方法是什么

rdd2 = [('a', (5, 2)), ('b', (6, 9)), ('c', (1, 7))]