Python中文
首页
教程
问答
标签
搜索
登录
注册
如何在spark rdd中执行虚拟查找
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有两个rdd</p> <pre><code>rdd1 =[('1', 3428), ('2', 2991), ('3', 2990), ('4', 2883), ('5', 2672), ('5', 2653)] rdd2 = [['1', 'Toy Story (1995)'], ['2', 'Jumanji (1995)'], ['3', 'Grumpier Old Men (1995)']] </code></pre> <p>我想执行一个操作,将第一个rdd的第一个元素与第二个rdd的第二个元素关联起来</p> <p>我的最终结果是这样的</p> <pre><code>[(''Toy Story (1995)'', 3428), ('Jumanji (1995)', 2991), ('Grumpier Old Men (1995)', 2990)] </code></pre> <p>请给我一个方法来执行这个</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>使用联接和映射:</p> <pre><code>rdd1.join(rdd2).map(lambda x: (x[1][1], x[1][0])).collect() #[('Toy Story (1995)', 3428), # ('Jumanji (1995)', 2991), # ('Grumpier Old Men (1995)', 2990)] </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
当启用身份验证时,超过一定大小的http发布失败
6 回答
当呈现Flask温度时,bokeh图为空
2 回答
当呈现模板时,如何引用sqlalchemy中的自定义字段?
4 回答
当周围有更多相同类型的标记时,如何从一个标记中提取数据
8 回答
当周数跨越多个y时,如何使用Pandas groupby week
10 回答
当呼唤django和python提示时
7 回答
当命令`Brew installPython@2`然后出现错误“Theme error”。如何解决?
7 回答
当命令[1]不存在时,用户输入命令以列出超出范围的索引
6 回答
当命令/启动被发送到bot时,bot应该删除发送给组的标签;但是bot没有
8 回答
当命令lin执行时,导入datetime会在Python脚本中引发ModuleNotFound“math”
8 回答
当命令中提到Bot时,Bot发送其前缀
4 回答
当命令位于DM中时,Python Discord.py bot将角色分配给服务器中的用户
8 回答
当命令在discord.py中缺少必需的参数时,如何显示消息
3 回答
当命令在多个不同的服务器上处于活动状态时,如何在discord.py上使用while循环
2 回答
当命令在提示符下成功运行时,Python subprocess.check_输出产生错误
6 回答
当命令提示时自动按键按回车键
4 回答
当命令提示符意外关闭时,如何访问python虚拟环境?
7 回答
当命令提示符给出导入错误时,当我尝试运行服务器python文件时,需要进行什么更改?
7 回答
当命令有双引号时,如何从python运行windows命令行命令
5 回答
当命令的一部分来自用户inpu时在linux服务器上执行命令的安全方法
2 回答