轻松地将包含大量PDF文档的子目录转换为数据集,支持提取文本和图像
pdf2dataset的Python项目详细描述
轻松地将包含大量PDF文档的子目录转换为数据集,支持提取文本和图像
- 此包Python名称:pdf2dataset
- 目前版本: pdf2dataset 0.5.3
- 最后维护时间:Sep 13, 2020
- 摘要:Easily convert a subdirectory with big volume of PDF documents into a dataset, supports extracting text and images
- 安装命令:pip install pdf2dataset
- 其它:pdf2dataset 这个Python第三方库的作者没有提供更多的项目描述信息了,2020-12-30 17:39:38。
- 可以返回 PyPI第三方库 首页,查找更多相关Python包程序。
- 项目
标签: