pyspark是否有org.apache.spark.functions.transform的等价物？

1条回答

网友

1楼 · 发布于 2024-10-01 02:40:02

编辑：

要避免UDF，可以使用F.expr（'transform…'）：

import pyspark.sql.functions as F
from pyspark.sql.types import IntegerType

df = spark.createDataFrame([[[1,2]],[[3,4]]]).toDF('col')
df.show()
+   +
|   col|
+   +
|[1, 2]|
|[3, 4]|
+   +

df.select(F.expr('transform(col, x -> x+1)').alias('transform')).show()
+    -+
|transform|
+    -+
|   [2, 3]|
|   [4, 5]|
+    -+

旧答案：

IIUC，我认为等价物是UDFx+1是要应用的函数

import pyspark.sql.functions as F
from pyspark.sql.types import IntegerType

add = F.udf(lambda arr: [x+1 for x in arr], ArrayType(IntegerType()))
df.select(add('col')).show()
+      -+
|<lambda>(col)|
+      -+
|       [2, 3]|
|       [4, 5]|
+      -+

编程相关推荐

java控制台返回扫描器捕获的第一件事，而不转移到其他代码块
java无法使用Jedis Lib本地连接到aws上的ElasticCache群集
java我正在尝试将GPS功能添加到我的安卓应用程序中，GPS坐标每次都是0.0,0.0
Java/Selenium RemoteWebDriver/Maven/JUnit在尝试调用浏览器时获取空会话id
java可自由拖动的TextView精细控件
java如何找到使用特定端口的神秘服务？
swing无法使用Ubuntu运行Java GUI程序
.net如何在java GUI应用程序中读取终端流？
使用ApacheMaven打包时出现java错误
java我需要帮助来制作文本框架

相关问题更多 >

编程相关推荐

热门问题

热门文章

pyspark是否有org.apache.spark.functions.transform的等价物？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >