如何在apachespark中并行读取多个表?

2024-09-30 22:16:49 发布

您现在位置:Python中文网/ 问答频道 /正文

我是新使用的apache spark

我已经在apachespark中使用Mllib构建了推荐的系统

我读了postgresql中的3个表(tb_a,tb_b,tb_c)

但我在执行时间上有问题,我想是因为spark read 3表顺序

如何用postgresql在pararel中生成spark read表?在

泰铢

注:我在spark中使用python


Tags: read顺序postgresqlapache系统时间tbspark