在pyspark中连接两个嵌套列

1条回答

网友

1楼 · 发布于 2024-09-22 14:28:23

查找内联代码注释以获得答案解释

import org.apache.spark.sql.SparkSession
import org.apache.spark.sql.functions._

object SampleJsonData {

  def main(args: Array[String]): Unit = {
    val spark = SparkSession.builder.master("local[*]").getOrCreate;


    //Load your JSON
    val df = spark.read.json("src/main/resources/sampleJsonData.json")

    //Add a new Column with name "fullname"
    df.withColumn("fullname",
      //Select nested "firstname.s" and "secondname.s" and assign it to "fullname.s"
      struct(concat(col("firstname.s"),lit(" "),col("secondname.s")).as("s")))
      //Write your JSON output
      .write.json("src/main/resources/sampleJsonDataOutput.json")


  }

}

编程相关推荐

java有没有一种在openGL上绘制立方体而不必指定每个坐标的方法？
java如何在安卓中实用地改变开关按钮的内部颜色？
java调用系统。gc（）导致JSP中的数据丢失
如何使用ApachePDFBOx2.0.8在Java Swing框架中可视化pdf，而不将其转换为图像
具有可空值的java筛选列表
java降低安卓中颜色的亮度？
java JSF/CDI依赖项注入ActionListener
java如何使EditTextView上的可见和不可见绘图向左？
java hibernate。cfg。在spring mv3应用程序中找不到xml
javascript如何用Java解析请求？

相关问题更多 >

编程相关推荐

热门问题

热门文章

在pyspark中连接两个嵌套列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >