我是分布式系统的新手,我的任务是分发一段现有的Python代码。目标是将代码视为二进制或库,并编写两种不同的包装器:
重复该过程,直到没有更多的数据到达主节点。可以用下图来举例:
所以两者都存在
(1)工人和主节点之间以及
(2)调用现有Python代码的需要。在
同样重要的是,整个框架以不可知论的方式看待“节点”的概念,因为它需要在节点等同于核心(物理或虚拟)的个人计算机上运行,或者在群集上运行,其中节点可以是具有多个核的整个计算机。因此,我正在寻找一种能帮助我实现这些目标的技术。我已经在研究apachespark,但我不完全确定Spark是否允许我以一种简化的方式执行Python代码,我正在寻找一些想法。在
查看^{} 作为一个简单的选项:
相关问题 更多 >
编程相关推荐