pyspark redueByKey修改单个结果

def combine_strings(x,y): if (isinstance(x,list) and isinstance(y, list)): z = x + y return z if (isinstance(x, list) and isinstance(y, str)): x.append(y) return x if (isinstance(x, str) and isinstance(y, list)): y.append(x) return y return [x,y]

1条回答

网友

1楼 · 发布于 2024-10-02 20:37:48

您可以首先将值映射到列表中，然后仅合并这些列表：

samp.mapValues(lambda x : [x]).reduceByKey(lambda x,y : x + y).collect()

这里的问题是这些单例不受reduceByKey的影响。下面是另一个例子：

samp = sc.parallelize([(1,1),(2,2),(2,2),(3,3)])
>>> samp.reduceByKey(lambda x, y : x + y + 1).collect()
[(3, 3), (1, 1), (2, 5)]

编程相关推荐

java文件路径中的java UTF8字符
java如何可靠地写入OPC UA服务器？
for-my-if语句中的java循环不能产生我想要的结果
java我如何在1个XSL中加入2个XML
macos无法在“/Library/Java/JavaVirtualMachines/jdk15.0.1.jdk/Contents/Home/bin/apt”中找到可执行文件
Java代码简单数学
java如何避免selenium中的sendKeys方法清除之前填充的文本？
java如何将PlacesAPI自动完成小部件传递到自定义对话框？
带有文本块的java Intellij json片段问题
启动时Spring启动错误：java。木卫一。IOException:jsse。别名\u否\u键\u项

相关问题更多 >

编程相关推荐

热门问题

热门文章

pyspark redueByKey修改单个结果

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >