Python slate包_程序模块 - PyPI

从pdf文档中轻松提取文本。

slate的Python项目详细描述

slate是一个python包，它简化了提取过程 PDF文件中的文本。这取决于pdfminer包。

slate提供了一个类，pdf。pdf接受一个类似文件的对象将从文档中提取所有文本，表示每一页作为文本字符串：

>>> with open('example.pdf') as f:
...    doc = slate.PDF(f)
...
>>> doc
[..., ..., ...]
>>> doc[1]
'Text from page 2...'

如果您的pdf受密码保护，请将密码作为第二个参数：

>>> with open('secrets.pdf') as f:
...     doc = slate.PDF(f, 'password')
...
>>> doc[0]
"My mother doesn't know this, but..."

更复杂的操作

如果您想访问图像、字体文件和其他信息，然后花点时间学习pdfminer api。

pdfminer怎么了？

Getting simple things done, like extracting the text is quite complex. The program is not designed to return Python objects, which makes interfacing things irritating.
It’s an extremely complete set of tools, with multiple and moderately steep learning curves.
It’s not written with hackability in mind.

欢迎加入QQ群-->： 979659372

slate 0.5.2

slate的Python项目详细描述

更复杂的操作

pdfminer怎么了？

推荐PyPI第三方库

cr-tools

modflow-export

CionAttack-Probabilit

warp

climatedata

outlookbot

odoo12-addon-maintenance-remote

khoros

galaxy-test-driver

odoo13-addon-account-move-force-removal

docassemble.microsoftgraph

contrive

sourc

sound-player

RM-Tools

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

slate 0.5.2

slate的Python项目详细描述

更复杂的操作

pdfminer怎么了？

推荐PyPI第三方库

cr-tools

modflow-export

CionAttack-Probabilit

warp

climatedata

outlookbot

odoo12-addon-maintenance-remote

khoros

galaxy-test-driver

odoo13-addon-account-move-force-removal

docassemble.microsoftgraph

contrive

sourc

sound-player

RM-Tools

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签