我有一个数据框,类型如下
col1|col2|col3|col4
xxxx|yyyy|zzzz|[1111],[2222]
我希望我的输出是以下类型
col1|col2|col3|col4|col5
xxxx|yyyy|zzzz|1111|2222
我的col4是一个数组,我想把它转换成一个单独的列。需要做什么?
我用flatmap看到了很多答案,但是它们增加了一行,我只想把元组放在另一列,但是放在同一行
以下是我的实际架构:
root
|-- PRIVATE_IP: string (nullable = true)
|-- PRIVATE_PORT: integer (nullable = true)
|-- DESTINATION_IP: string (nullable = true)
|-- DESTINATION_PORT: integer (nullable = true)
|-- collect_set(TIMESTAMP): array (nullable = true)
| |-- element: string (containsNull = true)
也可以请一些人帮助我解释数据帧和RDD的
创建示例数据:
使用
getItem
从数组列中提取元素,在实际情况下,将col4
替换为collect_set(TIMESTAMP)
:相关问题 更多 >
编程相关推荐