databricks dbfs是否支持文件/文件夹创建日期或修改日期等文件元数据

2024-10-03 02:47:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图在databricks笔记本中的目录中爬行,以查找最新的拼花地板文件。dbfsutils.fs.ls似乎不支持有关文件或文件夹的任何元数据。python中是否有其他方法可以做到这一点?数据存储在azure数据池中,该数据池安装在DBFS的“/mnt/foo”下。感谢您的帮助或指点


Tags: 文件数据方法目录文件夹笔记本azurefs
1条回答
网友
1楼 · 发布于 2024-10-03 02:47:42

在我所知的Azure Databricks上,dbfs路径dbfs:/mnt/foo与Linux路径/dbfs/mnt/foo相同,因此您只需在Python中使用^{}即可获得文件元数据,如创建日期或修改日期

enter image description here

这是我的示例代码

import os
from datetime import datetime
path = '/dbfs/mnt/test'
fdpaths = [path+"/"+fd for fd in os.listdir(path)]
for fdpath in fdpaths:
    statinfo = os.stat(fdpath)
    create_date = datetime.fromtimestamp(statinfo.st_ctime)
    modified_date = datetime.fromtimestamp(statinfo.st_mtime)
    print("The statinfo of path %s is %s, \n\twhich create date and modified date are %s and %s" % (fdpath, statinfo, create_date, modified_date))

结果如下图所示

enter image description here

相关问题 更多 >