有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

检测Tesseract OCR Java实现的大小字体

是否可以使用Tesseract OCR对图片进行OCR并识别图片中不同大小的字体。如果是,我是否需要使用任何其他第三方库,或者我是否可以使用纯Java。比如,

I want to detect the headline and the content of a newspaper by using the font size.

任何关于此事的帮助都将不胜感激


共 (2) 个答案

  1. # 1 楼答案

    Tesseract的hOCR输出包括行和字的边界框,可用于确定大小,并可通过打开hocr_font_infoconfig变量将其配置为在输出中还包括字体的点大小

  2. # 2 楼答案

    您可以使用ResultIterator。WordFontAttributes API方法(example in Java using Tess4J),用于检索识别文本的字体信息,包括字体名称和大小