擅长:python、mysql、java
<p><code>slice</code>函数也可以接受负索引<code>start</code>,以便从末尾开始。您需要4个部分,忽略最后一个部分,因此从-5开始,取4:</p>
<pre><code>from pyspark.sql.functions import col, split, slice
df = df.withColumn("newcol", slice(split(col("value"), "/"), -5, 4))
df.select("newcol").show(truncate=False)
#+ -+
#|newcol |
#+ -+
#|[bamboohr_custom_turnover_data, 2020, 12, 10]|
#|[] |
#|[processed, bamboohr, employee, 04-08-2020] |
#|[user, year=2020, month=09, day=22] |
#+ -+
</code></pre>