PySpark UnpicklingError:NEWOBJ类参数具有空tp\n

1条回答

网友

1楼 · 发布于 2024-09-28 20:48:43

rdd = sc.parallelize([('HOMICIDE', {'2017': 1}), 
                      ('DECEPTIVE PRACTICE', {'2015': 2, '2017': 2, '2016': 8}), 
                      ('ROBBERY', {'2016': 2})])

rdd.flatMapValues(lambda data: data.items()).collect()

[('HOMICIDE', ('2017', 1)),
 ('DECEPTIVE PRACTICE', ('2015', 2)),
 ('DECEPTIVE PRACTICE', ('2017', 2)),
 ('DECEPTIVE PRACTICE', ('2016', 8)),
 ('ROBBERY', ('2016', 2))]

在dict.项目是方法描述符。您必须提供一个函数来通知flatmap如何解压缩这些值。我通过将labmda函数传递给flatMap函数来实现这一点。在

编程相关推荐

java GWT对话框从不显示帮助
java在简单的MapReduce作业中带来了极大的开销
javacom。mysql。jdbc。例外情况。jdbc4。MySQLIntegrityConstraintViolationException:列不能为null/onetoone映射
如何通过TCP/IP与Java和Labview进行通信，并发送浮点数据缓冲区？
java Apache camel与spring事件基本示例
java如何使我的秒表应用程序在完全关闭后仍能运行？
java Nutch爬网错误输入路径不存在
java是Mapreduce中按值传递还是按引用传递的键？
正则表达式替换java中的特定字符
Java DOM XML解析

相关问题更多 >

编程相关推荐

热门问题

热门文章

PySpark UnpicklingError:NEWOBJ类参数具有空tp\n

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >