2024-05-06 03:12:34 发布
网友
我想在pyspark数据帧中创建从指定数字开始的序列号列。例如,我想将列A添加到我的dataframedf中,它将从5开始到我的数据帧的长度,递增1,因此5,6,7,…,length(df)。在
使用pyspark方法的一些简单解决方案?在
您可以使用范围
df_len = 100 freq =1 ref = spark.range( 5, df_len, freq ).toDF("id") ref.show(10) + -+ | id| + -+ | 5| | 6| | 7| | 8| | 9| | 10| | 11| | 12| | 13| | 14| + -+
仅显示前10行
您可以使用范围
仅显示前10行
相关问题 更多 >
编程相关推荐