火花fi上的pickle错误

2024-10-01 00:35:01 发布

您现在位置:Python中文网/ 问答频道 /正文

当我使用引用一个对象的闭包过滤RDD时,我得到一个pickle错误。在

没有对象:

>>> a
MapPartitionsRDD[369] at mapPartitions at SerDeUtil.scala:143
>>> b = a.filter(lambda row: row.foo == 1)
>>> b
PythonRDD[374] at RDD at PythonRDD.scala:43

对于对象:

^{pr2}$

我做错什么了?在


Tags: 对象lambdafoo错误filterpickleatrow
1条回答
网友
1楼 · 发布于 2024-10-01 00:35:01

z还包含哪些字段?序列化闭包时,传递的是对象,而不仅仅是要访问的字段。如果任何其他字段引用不可序列化的实体(例如:Spark Context object),您将得到一个序列化错误。在

相关问题 更多 >