我是一个H2O和spark框架的新手,我在数据块中的登入H2O+Spark (sparkling-water)
PySparkling有问题。在1.5.2环境中,我有一个运行在Databricks中的12个worker集群。
我采取的步骤如下:
1将H2O所需的(已安装)库(六个、请求、表格和将来的)附加到我的集群
然后,我从sparkling-water-1.5.14.zip包中解压后,从sparkling-water-1.5.14/py/dist
文件夹中取出了必需的.egg文件。
{/mycluster
我能成功地import h2o
。但是,当我在Databricks中的python NB中运行以下单元时,会出现以下异常:
在Spark顶部启动H2OContextfrom pysparkling import *
hc = H2OContext(sc).start()
import h2o
我有以下错误
py4j.Py4JException: Method addURL([class java.net.URL]) does not exist
衷心感谢您对如何解决此异常的任何指导。
这是一个bug in PySparkling。A fix已经提交,但仍在等待下一个版本,可能在1.5.15中引入。在
你可以试着自己用这个树枝来建造气泡水,在我们发布下一个版本之前使用它。在
相关问题 更多 >
编程相关推荐