使用AW处理大量图像

2024-09-27 07:21:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我在S3中存储了很多100K+的图像,我有一些代码使用pySpark来处理其中的一些。我正在使用anacondapython,因此已经正确安装了大量库,我正在使用库scipyPIL进行图像处理。你知道吗

我计划使用电子病历,但以下是我的选择:

  1. 如何正确安装所有库而不在集群上造成太多麻烦:

For Python applications, simply pass a .py file in the place of instead of a JAR, and add Python .zip, .egg or .py files to the search path with --py-files. - [Spark Documentation]

  1. 它们还支持customized bootstrap在配置集群时安装软件。然而,事实证明Anaconda的linux安装并不像“yum install-y”那么简单。安装包括:

    • 下载anacondaxxx.sh公司你知道吗
    • 猛击anacondaxxx.sh公司你知道吗
    • #以互动方式回答4或5个问题
    • 。。你知道吗

有人能告诉我正确的方向吗?用Spark和anacondapython(或者至少是scipy和PIL)构建集群的更好方法是什么。你知道吗


Tags: ofthe代码py图像pils3sh

热门问题