如何根据sp中的另一列数据更新列名

+-------------+----+------+--------+----+ | des| id|veh_cd|veh_p_cd|code| +-------------+----+------+--------+----+ |BodilyInjured|1001| 45| 50| BI_| |BodilyInjured|1001| 12| 55| BI_| | Collision|1001| 18| 21|col_| | Collision|1002| 21| 25|col_| +-------------+----+------+--------+----+

1条回答

网友

1楼 · 发布于 2024-05-19 10:24:21

您正在寻找pivot功能：

from pyspark.sql.functions import max

df1 = df.groupBy("id") \
       .pivot("code") \
       .agg(max("veh_cd"), max("veh_p_cd")) \
       .orderBy("id")

要重命名列，我们可以使用vanillaPythonregex：

import re

newnames = [re.sub("max|\(|\)", '', i) for i in df1.columns]
df1.toDF(*newnames).show()
+  +     +      +     -+      -+
|  id|BI__veh_cd|BI__veh_p_cd|col__veh_cd|col__veh_p_cd|
+  +     +      +     -+      -+
|1001|        45|          55|         18|           21|
|1002|      null|        null|         21|           25|
+  +     +      +     -+      -+

编程相关推荐

java无法从spring resttemplate访问sms网关
使用spark上下文方法参数的java并行化集合不正确
java中ReadLock的并发检查副本
java基于属性比较两个列表是否具有相同的元素
字符串Java文本块：缩进前缀中的制表符和空格的混合
java如何将带有@SpringBootApplication的maven模块作为测试范围中的依赖项添加到另一个maven模块
我需要一些关于在Java中使用2个jar文件的帮助
mysql JPA Java Spring Boot执行查找/连接表
java对话框选择具有特定名称的文件
java如何修复Spring工具套件4中的端口8080错误？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何根据sp中的另一列数据更新列名

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >