Databricks+H2O PySparkling:addURL py4jeexception

2024-09-30 01:28:25 发布

您现在位置:Python中文网/ 问答频道 /正文

我是一个H2O和spark框架的新手,我在数据块中的登入H2O+Spark (sparkling-water)PySparkling有问题。在1.5.2环境中,我有一个运行在Databricks中的12个worker集群。

我采取的步骤如下:
1将H2O所需的(已安装)库(六个、请求、表格和将来的)附加到我的集群

  1. 然后,我从sparkling-water-1.5.14.zip包中解压后,从sparkling-water-1.5.14/py/dist文件夹中取出了必需的.egg文件。

  2. {/mycluster

  3. 我能成功地import h2o。但是,当我在Databricks中的python NB中运行以下单元时,会出现以下异常:

    在Spark顶部启动H2OContext
    from pysparkling import * hc = H2OContext(sc).start() import h2o

我有以下错误

py4j.Py4JException: Method addURL([class java.net.URL]) does not exist

衷心感谢您对如何解决此异常的任何指导。


Tags: 数据import框架环境集群spark新手water

热门问题