pyspark:IOError:[Errno 20]不是目录(egg文件导入)

2024-09-30 06:28:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图用一个.egg文件运行pyspark作业。文件中有一些代码引用了.egg文件中的.json文件。在

我使用操作系统路径目录名(文件)然后将路径附加到它。在

路径看起来像:

/private/var/folders/8b/85wbwwxn2n31zfl1dgcpcfxs1d0qjg/T/spark-347c3633-7d95-467c-a222-83965afc7f34/userFiles-d0c02f9a-3c54-4f50-bb14-550a1bdcc26b/normalize-3.0-py3.5.egg/i18naddress/data/us.json

我的目录结构是:

normalize-3.0-py3.5.egg
--i18naddress
----_init_.py (the class I call)
----data
------us.json

相对路径看起来是正确的,但是spark无法读取这些文件并引发IO错误。有人能告诉我我做错了什么吗?在


Tags: 文件代码路径jsondataegg作业private

热门问题