生成用于填充Pyspark数据框中NULL值的随机日期

2024-06-30 14:53:39 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个带有一些空值的pyspark数据帧,我想用给定范围(2015-01-01到2019-01-01)中的随机日期来替换它们

我试着生成随机数并把它们连接起来,然后得到一个随机值。但是,所有的空值都将被相同的随机值替换

data.withColumn('birth_date',when(F.col('birth_date').isNull(),(str(randint(2015,2019))+"-"+str(randint(1,12))+"-"+str(randint(1,31)))).otherwise(F.col('birth_date'))

如何为每个空值填充不同的随机日期


Tags: 数据datadatecolpysparkwhenbirth空值