有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!


共 (1) 个答案

  1. # 1 楼答案

    如果您想自己构建整个应用程序,那么您正在规划的任务非常复杂。 但是在第三方工具的帮助下,你只需要几行代码就可以做到这一点。 步骤:

    1. 使用扫描仪附带的软件或任何其他第三方工具将文档扫描为pdf格式
    2. 使用其他软件/库从pdf中提取文本。我在谷歌上搜索时,发现了PDFBox API

      PDFBox is a library which can handle different types of PDF documents including encrypted PDF formats and extracts text and has a command line utility as well to convert PDF to text documents.

      使用API的示例here

    3. 修改上面的类或编写一个新类来读取文本文件并构造树结构