Pyspark RDD收集前163行 - 问答 - Python中文网

Pyspark RDD收集前163行

2024-09-28 17:18:07 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

有没有办法在不转换为df的情况下获得rdd的前163行？

我尝试过类似newrdd = rdd.take(163)的方法，但这会返回一个列表，并且rdd.collect()会返回整个rdd。

有办法吗？或者如果没有，是否有办法将列表转换为rdd？

Tags：方法 df 列表情况 collect rdd take 办法

1条回答

网友

1楼 · 发布于 2024-09-28 17:18:07

它不是很有效，但是您可以zipWithIndex和filter：

rdd.zipWithIndex().filter(lambda vi: vi[1] < 163).keys()

实际上，简单地说take和parallelize更有意义：

sc.parallelize(rdd.take(163))

相关问题更多 >

编程相关推荐

热门问题

热门文章