我正在将JSON文件摄取到spark中,在文件的嵌套JSON中遇到了一个对象,如下所示
"data": {
"key1" :"v1"
"key2" : [
{"nk1" :"nv1"},
{"nk2" :"nv2" },
{"nk3" :"nv3" }
]
}
在spark中读取后,它将更改为以下格式:
"data": {
"key1" :"v1"
"key2" : [
{"nk1" :"nv1", "nk2" :null, "nk3" :null},
{"nk1" :null, "nk2" :"nv2", "nk3" :null},
{"nk1" :null, "nk2" :null, "nk3" :"nv3"}
]
}
我需要它们作为spark数据框中的列
请帮我解决这个问题。我正在考虑将其转换为字符串并使用正则表达式。有没有更好的解决办法
可以分解阵列和轴键2:
相关问题 更多 >
编程相关推荐