用pysp截断字符串

2条回答

网友

1楼 · 编辑于 2024-09-26 04:52:07

带有regexp_extract的正则表达式：

from pyspark.sql.functions import regexp_extract

df = spark.createDataFrame([("8841673_3", )], ("id", ))

df.select(regexp_extract("id", "^(\d+)_.*", 1)).show()
# +                +
# |regexp_extract(id, ^(\d+)_.*, 1)|
# +                +
# |                         8841673|
# +                +

regexp_replace：

^{pr2}$

或者只是split：

from pyspark.sql.functions import split

df.select(split("id", "_")[0]).show()
# +       -+
# |split(id, _)[0]|
# +       -+
# |        8841673|
# +       -+

网友

2楼 · 编辑于 2024-09-26 04:52:07

您可以使用^{}方法：

import pyspark.sql.functions as F

def left(x, n):
    return x.substr(0, n)

def right(x, n):
    x_len = F.length(x)
    return x.substr(x_len - n, x_len)

编程相关推荐

java如何正确测试和调试使用照相机闪光灯的应用程序？
组织。jboss。放松点。spi。未处理的异常：java。lang.NoSuchMethodError:org。冬眠SessionFactory。openSession（）Lorg/hibernate/Session；
在同一行上声明多个Java数组？
java Spring批处理管理员，无法替换占位符“批处理”。商业模式。脚本'
使用JQuery的网站上出现java HtmlUnit“不支持浏览器”错误
java JavaFX如何将图形“裁剪”到按钮
java处理mysql中包含逗号的数字
java Hibernate语法错误：应为点
如何根据给定的日期在java中获取30天的回溯日期
java Servlet URL映射

相关问题更多 >

编程相关推荐

热门问题

热门文章

用pysp截断字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >