pdf解析器和分析器
pdfminer3的Python项目详细描述
gwk/pdfminer3是pdfminer/pdfminer.6的一个分支,它又派生自euske/pdfminer。
pdfminer3是从pdf文档中提取信息的工具。 与其他pdf相关工具不同,它完全专注于获取和分析文本数据。 pdfminer3获取页面中文本的准确位置,以及其他信息,如字体或行。 它包括一个pdf转换器,可以将pdf文件转换为其他文本格式(如html)。 它有一个可扩展的pdf解析器,可以用于其他目的,而不是文本分析。