检测Tesseract OCR Java实现的大小字体
是否可以使用Tesseract OCR对图片进行OCR并识别图片中不同大小的字体。如果是,我是否需要使用任何其他第三方库,或者我是否可以使用纯Java。比如,
I want to detect the headline and the content of a newspaper by using the font size.
任何关于此事的帮助都将不胜感激
你可以在下面搜索框中键入要查询的问题!
是否可以使用Tesseract OCR对图片进行OCR并识别图片中不同大小的字体。如果是,我是否需要使用任何其他第三方库,或者我是否可以使用纯Java。比如,
I want to detect the headline and the content of a newspaper by using the font size.
任何关于此事的帮助都将不胜感激
# 1 楼答案
Tesseract的hOCR输出包括行和字的边界框,可用于确定大小,并可通过打开
hocr_font_info
config变量将其配置为在输出中还包括字体的点大小# 2 楼答案
您可以使用ResultIterator。WordFontAttributes API方法(example in Java using Tess4J),用于检索识别文本的字体信息,包括字体名称和大小