Spark数据帧到数据分析

Py4JJavaError: An error occurred while calling o114.collectToPython. : org.apache.spark.SparkException: Job aborted due to stage failure: Task 2 in stage 14.0 failed 4 times, most recent failure: Lost task 2.3 in stage 14.0 (TID 65, bdgtr026x30h4.nam.nsroot.net, executor 11): org.apache.spark.SparkException: Kryo serialization failed: Buffer overflow. Available: 0, required: 15823824. To avoid this, increase spark.kryoserializer.buffer.max value.

1条回答

网友

1楼 · 发布于 2024-09-29 23:30:43

不要在jupyter中设置配置，而是在创建spark会话时设置配置，因为一旦创建了会话，配置就不会更改

from pyspark.sql import SparkSession
spark = SparkSession \
.builder \
.appName("myApp") \
.config("spark.kryoserializer.buffer.max", "512m") \
.config('spark.kryoserializer.buffer', '512k') \
.getOrCreate()

您可以获取属性详细信息here

编程相关推荐

使用SeleniumWebDriver（又称Selenium2.0）JAVA向下滚动鼠标
java获取与消费者组kafka关联的主题列表
java在现实生活中，您什么时候会使用堆栈而不是常规链表，或者使用常规队列而不是优先级队列？
java实际参数列表和形式参数列表的长度不同（但两种长度都是2？）
默认情况下，Lucene（java框架）是否根据术语计算文档的tfidf和余弦相似性？
java编辑XML样式表更改Android中的按钮
java在Eclipse4中从处理程序更新视图
java是节点列表、数组、列表还是其他什么？
java Hibernate查询问题
java Spark在并行化列表时引发ArrayIndexOutOfBoundsException

相关问题更多 >

编程相关推荐

热门问题

热门文章