Pyspark得到TypeError:无法pickle\u abc\u数据对象

File “/Users/gmg/anaconda3/envs/env/lib**strong text**/python3.7/site-packages/pyspark/sql/udf.py”, line 189, in wrapper return self(*args) File “/Users/gmg/anaconda3/envs/env/lib/python3.7/site-packages/pyspark/sql/udf.py”, line 167, in __call__ judf = self._judf File “/Users/gmg/anaconda3/envs/env/lib/python3.7/site-packages/pyspark/sql/udf.py”, line 151, in _judf self._judf_placeholder = self._create_judf() File “/Users/gmg/anaconda3/envs/env/lib/python3.7/site-packages/pyspark/sql/udf.py”, line 160, in _create_judf wrapped_func = _wrap_function(sc, self.func, self.returnType) File “/Users/gmg/anaconda3/envs/env/lib/python3.7/site-packages/pyspark/sql/udf.py”, line 35, in _wrap_function pickled_command, broadcast_vars, env, includes = _prepare_for_python_RDD(sc, command) File “/Users/gmg/anaconda3/envs/env/lib/python3.7/site-packages/pyspark/rdd.py”, line 2420, in _prepare_for_python_RDD pickled_command = ser.dumps(command) File “/Users/gmg/anaconda3/envs/env/lib/python3.7/site-packages/pyspark/serializers.py”, line 600, in dumps raise pickle.PicklingError(msg) _pickle.PicklingError: Could not serialize object: TypeError: can’t pickle _abc_data objects

1条回答

网友

1楼 · 发布于 2024-09-27 21:24:17

似乎你也遇到了同样的问题，比如这期： https://github.com/cloudpipe/cloudpickle/issues/180

现在的情况是pyspark的cloudpickle库对于python3.7来说已经过时了，您现在应该用这个特制的补丁修复这个问题until pyspark gets that module updated。你知道吗

尝试使用此解决方法：

安装cloudpickle pip install cloudpickle
将此添加到代码中：

import cloudpickle
import pyspark.serializers
pyspark.serializers.cloudpickle = cloudpickle

monkeypatch信用卡https://github.com/cloudpipe/cloudpickle/issues/305

相关问题更多 >

编程相关推荐

热门问题

热门文章