Azure Databricks将拼花文件写入策展Zon

%python rawfile = "wasbs://xxxx@dxxxx.blob.core.windows.net/xxxx/2019-09-30/account.parquet" curatedfile = "wasbs://xxxx@xxxx.blob.core.windows.net/xxxx-Curated/2019-09-30/account.parquet" dfraw = spark.read.parquet(rawfile) dfraw.write.parquet(curatedfile, mode = "overwrite") display(dfraw)

1条回答

网友

1楼 · 发布于 2024-09-30 00:27:33

当用户在作业中写入文件时，DBIO将为您执行以下操作。你知道吗

使用唯一事务id写入的标记文件
将文件直接写入其最终位置。你知道吗
当作业提交时，将事务标记为已提交。你知道吗

在Spark的save中直接更改文件名是不可能的。你知道吗

Spark使用Hadoop文件格式，它要求对数据进行分区—这就是为什么要使用部件文件。处理后可以很容易地更改文件名，就像在SO线程中一样。你知道吗

您可以参考类似的SO线程，它解决了类似的问题。你知道吗

希望这有帮助。你知道吗

编程相关推荐

返回多个java类
java GWT 2.5.1序列化和子类化问题
java如何在安卓应用程序上显示wordpress post图像链接
createValidator（）方法的java JAXBContext UnsupportedOperationException
使用Cookie/sessions Java Servlets存储用户名、密码和密码的表单
java如何利用文件I/O来创建字母？
java为什么图像保存不再在API 29上工作
javafx作为函数参数传递getter数组java
java hibernate列唯一性问题
java如何从用户输入中删除2d数组中的行

相关问题更多 >

编程相关推荐

热门问题

热门文章

Azure Databricks将拼花文件写入策展Zon

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >