DataFrame.show（）在DataRicks中引发错误

df = spark.read \ .format("com.databricks.spark.sqldw") \ .option("url", sqlDwNew) \ .option("tempDir", temDir_location) \ .option("forwardSparkAzureStorageCredentials", "true") \ .option("query", "select * from AccessPermission") \ .load() df.count()

1条回答

网友

1楼 · 发布于 2024-10-01 04:45:07

要知道确切的原因，我会要求您检查完整的堆栈跟踪，并试图找到问题的根本原因

根据我的记录，我遇到了完全相同的错误消息，并且能够通过查看堆栈跟踪并找到存储帐户配置的问题来解决问题

com.databricks.spark.sqldw.SqlDWSideException: SQL DW failed to execute the JDBC query produced by the connector.
.
.
.
.
.   

 Caused by: java.lang.IllegalArgumentException: requirement failed: No access key found in the session conf or the global Hadoop conf for Azure Storage account name: chepra

步骤1:在笔记本会话配置中设置Blob存储帐户访问密钥

spark.conf.set(
  "fs.azure.account.key.<your-storage-account-name>.blob.core.windows.net",
  "<your-storage-account-access-key>")

步骤2:从Azure Synapse查询加载数据

df = spark.read \
  .format("com.databricks.spark.sqldw") \
  .option("url", "jdbc:sqlserver://<the-rest-of-the-connection-string>") \
  .option("tempDir", "wasbs://<your-container-name>@<your-storage-account-name>.blob.core.windows.net/<your-directory-name>") \
  .option("forwardSparkAzureStorageCredentials", "true") \
  .option("query", "select  * from table") \
  .load()

步骤3:显示或显示数据帧

df.show()
display(df)

参考：Azure Databricks - Azure Synapse Analytics

输出

错误

输出

相关问题更多 >

编程相关推荐

热门问题

热门文章

DataFrame.show（）在DataRicks中引发错误

输出

错误

输出

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >