使用PySp在ArrayType列中按项分组

id address phone_list 1 HaNoi [ 012346789, 032145698, 0565622253 ] 2 Singapore [ 012346789, 069855633 ] 3 Moscow [ 023466466, 069855633 ] 4 Tokyo [ 044656611, 061316561 ]

id address phone_list 1 [ HaNoi , Singapore, Moscow ] [ 012346789, 032145698, 0565622253, 069855633, 023466466 ] 2 [ Tokyo ] [ 044656611, 061316561 ]

2条回答

网友

1楼 · 编辑于 2024-10-06 15:22:53

你将需要首先爆炸的电话号码，然后做一个小组的电话号码和收集名单的地址。此外，您还需要收集电话号码上的\u集（collect \u set（）包含不同的元素，collect \u list（）包含所有元素）以获得不同的电话号码集。如果你想要完整的代码，请告诉我。你知道吗

网友

2楼 · 编辑于 2024-10-06 15:22:53

在你的情况下我会做的是

df= pyspark.sql('''select id, address, phone_number 
from table_name as tb  LATERAL VIEW EXPLODE(tb.phone_list)as phone_number ''')

我会按电话号码分组！你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章