我的日期格式是m/dd/yyyy h:mm和mm/dd/yyyy h:mm,我希望输出格式是sparksql中的yyyymmdd hh:mm:ss。但是我得到了nu

2024-10-04 05:31:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我的值是2017年4月5日0:00和2016年12月21日0:00 我要yyyy-mm-dd hh:mm:ss格式。
我用这个来完成任务。在

 stf1.withColumn('approval',unix_timestamp("approval","MM/dd/yyyy h:mm ")

其中sf1是dataframe,approval是我要转换为的列名。但是我得到的答案是null。而不是预期的。在


Tags: 答案dataframe格式hhunixsstimestampdd
1条回答
网友
1楼 · 发布于 2024-10-04 05:31:47

您可以使用sql函数来实现这一点。在

>>> import pyspark.sql.functions as F
>>> df.show()
+      -+
|            a|
+      -+
|4/5/2017 0:00|
+      -+

>>> df.withColumn('b',F.date_format(F.to_date('a','MM/dd/yyyy HH:mm'),'yyyy-MM-dd HH:mm:ss')).show()
+      -+         -+
|            a|                  b|
+      -+         -+
|4/5/2017 0:00|2017-04-05 00:00:00|
+      -+         -+

相关问题 更多 >