Microsoft复合文件二进制文件格式IO
cfb的Python项目详细描述
cfbio提供对Microsoft复合文件二进制文件内部结构的访问 文件格式。
模块使用输入文件操作,就像python中的标准io模块一样。你可以 找,读,也许有一天会写这些文件,就像所有其他文件一样 物体。模块还授予对包含 条目,也是标准可读/可查看的对象。
因此,您使用本模块的工作非常简单:
from cfb import CfbIO from cfb.directory.entry import SEEK_END doc = CfbIO("tests/data/simple.doc") root = doc.root print(root.read()) # Read whole root entry buffer some_entry = doc.directory[1].left some_entry.seek(100, whence=SEEK_END) print(some_entry.read(100)) # Read last 100 bytes from left sibling
所有的类都很懒,所以您可以读取非常大的文件,而不会出现内存泄漏。 当您需要时,所有数据都将是只读的。