如何在pyspark dataframe中将一列中的字典列表拆分为两列？

customer_id|pincode|filteredaddress| Flag| Address 1000045801 |121005 |[{'flag':'0', 'address':'House number 172, Parvatiya Colony Part-2 , N.I.T'}] 1000045801 |121005 |[{'flag':'1', 'address':'House number 172, Parvatiya Colony Part-2 , N.I.T'}] 1000045801 |121005 |[{'flag':'1', 'address':'House number 172, Parvatiya Colony Part-2 , N.I.T'}]

1条回答

网友

1楼 · 发布于 2024-10-16 20:51:44

您可以使用以下键从filteredaddress映射列获取值：

df2 = df.selectExpr(
    'customer_id', 'pincode',
    "filteredaddress['flag'] as flag", "filteredaddress['address'] as address"
)

访问地图值的其他方法有：

import pyspark.sql.functions as F

df.select(
    'customer_id', 'pincode',
    F.col('filteredaddress')['flag'],
    F.col('filteredaddress')['address']
)

# or, more simply

df.select(
    'customer_id', 'pincode',
    'filteredaddress.flag',
    'filteredaddress.address'
)

编程相关推荐

java希望直接扫描要上传到网页的文档
java JavaFX使对象可见，但不使用（忽略）点击
java LibGdx奇怪的纹理行为
java JavaFx ComboBox在第一次单击时未获得正确的值
api WebDav服务器库最好使用Java
java在Android中维护应用程序状态
java保存在Android中拖放RecyclerView后所做的更改我已经阅读了所有内容
无法读取项目中所需库tomcatembedwebsocket的java存档，或者该存档不是有效的ZIP文件
c#类在系统中有哪些关联？如何在UML中最好地表示它们？
java如何使用bazaar访问两台计算机上的同一文件夹

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在pyspark dataframe中将一列中的字典列表拆分为两列？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >