pdf formulas将pdf的公式转储为“formulas”子文件夹中的png文件。

pdfformulas的Python项目详细描述


用法:pdfformulas.py[-h][-dxmin dxmin][-frompage frompage]
[-顶部页面][-页面页面][-公式化ID公式化ID] [–统计] Pdfile

将pdf的公式作为png文件转储到formulas子文件夹中。这个 子文件夹formulas已创建(如果尚未创建)。PDF内容必须是 可作为文本访问。

位置参数:
pdf file pdf文件,用于解析和转储的公式
可选参数:
-h, --helpshow this help message and exit
--dxmin DXMINAdditional left margin, which defines what is normal text. If the text before a formula is the beginning of a paragraph it might start a little indented. In this case it helps to move dxmin to the right. Units are those used in the PDF. Try 10.
--frompage FROMPAGE
PDF page number to start with.
--topage TOPAGE
PDF page number to stop at.
--page PAGEPDF page number
--formulaid FORMULAID
The regular expression by which a formula is found. Formulas are recognized by their ID on the right. The regular expression used is:: r’^s*(d*.d*)s* ‘ e.g.:: (2.13) To find the rectangle comprising the formula the text before and after is located, which begins on the left of the page (dxmin). The formula is assumed to be indented with regard to normal text.
--statsOnly print (formula,page)-refs statistics. This tells which formulas are most often referenced in normal text and are thus likely the most important ones.

需要:枕头、pymupdf(需要安装兼容的mupdf)、pdfminer 安装:libmupdf和pymupdf需要预先安装。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java在Websphere MQ临时队列上未收到回复   泛型构造函数在Java中的作用是什么?   java在Youtube HTTP请求中指定空格字符   hashmap在Java中如何读取另一个地图中的地图?   如果有类,java将在编译时签入。类派生自另一个类。班   java在安卓 junit测试执行期间捕获logcat输出   java如何在列表中拆分不同类型的字符串   java仅从输入读取某些行?   java在执行jar后继续批处理文件   ICEPDF Java中书签的框架设置   java将文件上传到服务器根目录   java如何在Spring Boot中缓存CompletableFuture的值   java正则表达式来解析命令字符串   java Hibernate按关联属性过滤   使用Java提取HTML标记   java Hibernate配置使用JAR模块中的注释在Spring MVC EAR项目中不起作用   java为什么我在传递给freemarker的哈希映射上得到一个null值,而它不是null?