尝试提交python项目时找不到模块

2024-05-20 13:35:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我在yarn上运行spark2.2.0,试图提交python文件backtest.py,并将所有项目文件压缩到prediction.zip。请参见下面的spark submit命令。在

问题是Spark找不到我的模块。 我错过了什么?在

HADOOP_CONF_DIR="/etc/hive/conf.cloudera.hive" \
SPARK_HOME="/opt/spark/spark-2.2.0-bin-hadoop2.7" \
PYSPARK_PYTHON="/opt/anaconda/bin/python" \
PYSPARK_DRIVER_PYTHON="/opt/anaconda/bin/python" \
sudo -u hdfs \
/opt/spark/spark-2.2.0-bin-hadoop2.7/bin/spark-submit \
--master yarn \
--conf "spark.sql.shuffle.partitions=2001" \
--conf "spark.executorEnv.PYTHONHASHSEED=0" \
--deploy-mode cluster \
--master yarn \
--py-files /home/gals/prediction.zip \
/home/gals/parent/prediction/backtesting/backtest.py

Tags: 文件pymasterbinconfanacondazipspark