擅长:python、mysql、java
<p>您可以使用sparksql函数<code>slice</code>和<code>size</code>来实现切片。请注意,Spark SQL数组索引从1开始,而不是从0开始</p>
<pre><code>df2 = df.selectExpr("slice(split(value, '/'), 4, size(split(value, '/')) - 4) newcol")
df2.show(truncate=False)
+ -+
|newcol |
+ -+
|[bamboohr_custom_turnover_data, 2020, 12, 10]|
|[] |
|[employee, 04-08-2020] |
|[user, year=2020, month=09, day=22] |
+ -+
</code></pre>