2024-10-02 22:29:12 发布
网友
如何从docx文件中提取元数据(例如,FileSize、FileModifyDate、FileAccessDate)
您应该使用Python-Docx。pythondocx有一个方法core_properties,您可以使用它。此方法提供了15个元数据属性,如author、category等。请参阅下面的代码,将一些元数据提取到python字典中-
core_properties
import docx def getMetaData(doc): metadata = {} prop = doc.core_properties metadata["author"] = prop.author metadata["category"] = prop.category metadata["comments"] = prop.comments metadata["content_status"] = prop.content_status metadata["created"] = prop.created metadata["identifier"] = prop.identifier metadata["keywords"] = prop.keywords metadata["language"] = prop.language metadata["modified"] = prop.modified metadata["subject"] = prop.subject metadata["title"] = prop.title metadata["version"] = prop.version return metadata doc = docx.Document(file_path) metadata_dict = getMetaData(doc)
您应该使用Python-Docx。pythondocx有一个方法
core_properties
,您可以使用它。此方法提供了15个元数据属性,如author、category等。请参阅下面的代码,将一些元数据提取到python字典中-相关问题 更多 >
编程相关推荐