使用OLE工具从Python(Linux)的VSD(windowsvisio二进制)文件中读取数据是非常不清楚的,有没有其他方法可以提取数据?

2024-09-30 16:28:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试读取一个Visio Binary.VSD文件的内容,该文件包含我制作的图形中的信息。在

我尝试过使用OLE工具和OLEFile,但无法正确读取内容。我可以用OLETools查看文件。当我转储内容并使用“xxd”命令(在终端中)查看时,我无法清楚地看到保存在文件中的文本。文件中有很多额外的\x00、\xff等字符和其他字符,删除这些字符会使文件更糟。我对一个.doc文件做了完全相同的操作,我已经能够打开并清楚地阅读其中的内容。在

如果我做错了这件事,有人能给我指出正确的方向吗?或者更确切地说,是指向其他工作正常的工具的方向吗?在


Tags: 文件工具命令信息图形内容方向字符
2条回答

谢谢你的帮助。在

我找到了一种从文件中提取纯文本并将其转换为XHTML并进行解析的方法。主要的问题是现在我失去了原始文档可能有的任何结构。在

这些工具是libvisio工具 https://launchpad.net/ubuntu/trusty/+package/libvisio-tools

安装将提供以下程序 文本,VSD2VSD2VSD2 它可以从终端运行来转换文件

你真的选择了一个强大的敌人:)

与其他office应用不同,Visio.vsd二进制文件格式并不完全是微软的“复合文档”,它基本上只是一个包装器。这种格式是由Visio公司在199x年创建的,而AFAIK实际上从未公开记录过。在

如果可能的话,我真的建议你不要使用binary.VSD。最新的Visio支持标准的openxml格式(.vsdx),基本上是一堆压缩的xml文件。在

AFAIK是已知的唯一能理解二进制的第三方库。vsd是一个示意图,但它不是免费的。在

相关问题 更多 >