如何迭代RDD中的值(key,value)。在
tsRDD.map(lambda x:(x,1)).groupByKey()
退货
^{pr2}$我想遍历<pyspark.resultiterable.ResultIterable
对象并找到它所有元素的和。在
我试过了
tsRDD.map(lambda x:(x,1))).countByKey().items()
它回来了
`[('abc', 2), ('pqr', 1), ('xyz', 2)]`
但是我需要使用.map
.reduceByKey()
方法
有什么想法吗?或者我们能做些什么?在
在这种特殊情况下,最有效的方法是使用^{} ,而不是{}:
一般情况下,当你有
^{2}$PairwiseRDD
时,你可以map
或
mapValues
:相关问题 更多 >
编程相关推荐