spark 1.3.0，python，avro文件，driverclasspathsparkdefaults.conf但奴隶看不到

conf = None rddAvro = sc.newAPIHadoopFile( fileAvro, "org.apache.avro.mapreduce.AvroKeyInputFormat", "org.apache.avro.mapred.AvroKey", "org.apache.hadoop.io.NullWritable", KeyConverter="org.apache.spark.examples.pythonconverters.AvroWrapperToJavaConverter", conf=conf)

1条回答

网友

1楼 · 发布于 2024-10-04 11:27:22

尝试使用选项master yarn cluster运行它

根据数据的大小，您可以通过在以下配置参数中添加更多数字来为每个容器分配更多内存：

在纱线.节点管理器.资源.内存mb

在纱线调度程序最大值-分配mb

spark提交主纱客户数量执行器5个驱动核心8个驱动程序内存50G执行器内存44G代码_运行.py在

编程相关推荐

java Android/OkHttp获取源代码
java如何清理jComboBox中的空白
java Dagger 2和改型2更改基本URL
java while（1）使用continue和break语句循环
java如何在JGroup中禁用FIFO和重新传输协议？
java Log4j 2 JSON模式布局+记录JSON负载
google应用程序引擎Firebase Java管理SDK错误
如果我已经编写了显示目录的代码，我将如何制作它，以便java能够说明这个结果是一个文件，还是另一个目录/文件夹？
java Twilio:Twilio。装置connect（）未命中语音请求URL
在Java中加载带有JRI的R库时写入内核转储失败

在纱线.节点管理器.资源.内存mb

在纱线调度程序最大值-分配mb

相关问题更多 >

编程相关推荐

热门问题

热门文章

spark 1.3.0，python，avro文件，driverclasspathsparkdefaults.conf但奴隶看不到

在纱线.节点管理器.资源.内存mb

在纱线调度程序最大值-分配mb

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >