我想要的是将列名映射到键中。 例如:
#+-------+----------+
#|key1 |key2 |
#+-------+----------+
#|value1 |value2 |
#|value3 |value4 |
#+-------+----------+
将转化为
#+-------+----------+
#| keys|values |
#+-------+----------+
#|key1 |value1 |
#|key1 |value2 |
#|key2 |value3 |
#|key2 |value4 |
#+-------+----------+
在HiveQL中,我可以编写类似于
select distinct key, velue
from xxx
lateral view explode(map(
'key1', key1,
'key2', key2) tab as key, value
但是如何在Pypark写。 我可以使用createtentable,但我认为这不是最好的解决方案/
使用^{} 函数创建映射列,然后将其分解。你知道吗
create_map
需要分组的列表达式列表 作为键值对。可以使用创建这样的列表,以便理解数据帧列:像这样的?你知道吗
那就是
spark.sql()
。你知道吗相关问题 更多 >
编程相关推荐