擅长:python、mysql、java
<p>有一个丑陋的方法</p>
<pre><code>from pyspark.sql.functions import *
from pyspark.sql.types import StringType
def update(interval,date):
if (interval == 1):
return date
elif (interval == 2):
return date + 'add 5 min'
elif (interval == 3):
return date + 'add 10 min'
#df.dtypes
my_udf = udf(lambda x,y: update(x,y), StringType())
df.withColumn('updated_realDateTime', my_udf(df.interval, df.realDateTime) ).show(truncate=False)
</code></pre>
<p>当然,我的更新功能不是你想要的,所以你必须改变它,但它会完成工作(你不需要elifs如果模式在所有间隔都是相同的,你可以使它动态)</p>
<p>下面是为任何有更好答案的人创建数据帧的代码</p>
^{pr2}$