如何在pysp中使用Pandas UDF功能

2024-09-27 17:52:19 发布

男 | 程序猿一只，喜欢编程写python代码。

我有一个spark框架，有两列，看起来像：

+-------------------------------------------------------------+------------------------------------+
|docId                                                        |id                                  |
+-------------------------------------------------------------+------------------------------------+
|DYSDG6-RTB-91d663dd-949e-45da-94dd-e604b6050cb5-1537142434000|91d663dd-949e-45da-94dd-e604b6050cb5|
|VAVLS7-RTB-8e2c1917-0d6b-419b-a59e-cd4acc255bb7-1537142445000|8e2c1917-0d6b-419b-a59e-cd4acc255bb7|
|VAVLS7-RTB-c818dcde-7a68-4c1e-9cc4-c841660732d2-1537146854000|c818dcde-7a68-4c1e-9cc4-c841660732d2|
|IW2BYL-RTB-E9727F7D-D1BA-479C-9D3A-931F87E78B0A-1537146572000|E9727F7D-D1BA-479C-9D3A-931F87E78B0A|
|DYSDG6-RTB-f50f79e9-3ec3-4bd8-8e53-f62c3f80bcb0-1537146220000|f50f79e9-3ec3-4bd8-8e53-f62c3f80bcb0|
+-------------------------------------------------------------+------------------------------------+

我有一个将id列转换为85位编码字符串的函数：

^{pr2}$

我想用pandas udf来转换它，据说它比普通的udf快

我怎样才能做到这一点？蒂娅。在

Tags： id spark udf rtb a59e f62c3f80bcb0 f50f79e9 vavls7

1条回答

网友

1楼 · 发布于 2024-09-27 17:52:19

完成了。简单的功能可以帮助实现这一点：

@pandas_udf(returnType=StringType())
def convert_id(id):
    converted = id.map(lambda x : str(bs.a85encode(bytearray.fromhex(str(x).replace("-", ""))))[2:-1])
    return converted

如何在pysp中使用Pandas UDF功能

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在pysp中使用Pandas UDF功能

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >