查找两个PDF文档之间的差异

pdf-diff的Python项目详细描述


pdf差异

查找两个PDF文档之间的差异:

  1. 比较两个pdf文档的文本层,并以json格式输出更改文本的边界框。
  2. 将PDF中更改的页面光栅化为PNG,并围绕更改的文本绘制红色轮廓。

Example Image Output

脚本是用python 3编写的,它依赖于pdftotext程序。

要求

libxml2 >= 2.7.0, libxslt >= 1.1.23, poppler

ubuntu的安装要求:

sudo apt-get install python3-lxml poppler-utils

OS X的安装要求:

brew install libxml2 libxslt poppler

安装

来自PYPI:

pip install pdf-diff

来源:

sudo python3 setup.py install

运行

将两个PDF转换为一个显示差异的大PNG图像:

pdf-diff before.pdf after.pdf > comparison_output.png

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何动态地为注释提供值?   活动上的java活动结果,并从片段返回   java按泛型元素对对象数组列表进行排序   java下拉菜单不显示(intellij gui编辑器)   在Android studio中使用截取从mysql服务器请求数据   java如何在安卓的另一个类中调用具有视图类型参数的函数   java Android应用程序切换活动   GridLayout的java透明背景   java在两点之间对角遍历2D数组   java Docker类。forName找不到类   HTML格式的javajarapplet   java为子实体生成的更新sql在Onetomany关系中不正确   java处理编码/解码输入   java Intellij 2019重新编译整类问题   使用nimbus的java自定义JButton   java将字符串转换为可读的SimpleDataFormat   java如何将字符串时间戳解析为LocalDateTime