使用Python从MySQL数据库表读取SparkSQL

2024-10-06 13:11:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我在MySQL中有一个“user”表。我想把它读给我的Spark SQL程序。如何使用Python从MySQL读取表到Apache Spark的SparkSQL模块?是否有可用于此任务的连接器? 谢谢。


Tags: 模块程序sqlapachemysqlsparkusersparksql
1条回答
网友
1楼 · 发布于 2024-10-06 13:11:27

有一个similar question answered。像这样开始pyspark

./bin/pyspark --packages mysql:mysql-connector-java:5.1.38

那就跑吧

sqlContext.read.format("jdbc").options(
url ="jdbc:mysql://localhost/mysql",
driver="com.mysql.jdbc.Driver",
dbtable="user",
user="root",
password=""
).load().take(10) 

这很可能是可行的。但这取决于mysql的设置,所以如果它不尝试更改密码、用户名、db url和其他设置。

相关问题 更多 >