Python：从图像中提取文本

sanna vioxva ON ‘sivan Hs3ae4 NOSAL -Aa aanesia 0 yep OF 10d ‘enous @989id Bq ayesphyoque 9 (639, ee anes 8 Siz aon ish Be peapoyemes | oP a RLM eLY pap Buinieg| § Bz) Zoy aig Suns! s$y084 U0} ayn

1条回答

网友

1楼 · 发布于 2024-09-27 19:29:26

pytesseract是为文档设计的，它希望文本在页面上保持笔直（就像普通文档一样）。如果你翻转你的图像，它应该工作得更好

编辑：代码为：

from PIL import Image
import pytesseract, re
f = "1591107148_festo.jpg"
t = pytesseract.image_to_string(Image.open(f).rotate(270))
print(t)

我得到：

ju have questions
ase call ou ones

Mam ount Per Serving:

~ {Calories 180 Calories from fat £70
AT AND/OR POULTRY, Sf

BACTERIA THAT COULD CAUSE IL

WISHANDLED OR COOKED INP
PROTECTION, FOLLOW THESE SAFE

VEEP REFRIGERATED
THAW IN REPRIGERA

Se _
=

‘otal Cal
rotein
fe

Please vomere of DP
prior to defrosting

DISTRIBUTED BY: TYSON FRESH MEATS, INC DAKOTA DUNES

我认为，如果你对图像进行预处理，即转换为二值图像，并将其倾斜直到文本完全笔直，你会得到更好的结果

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python：从图像中提取文本

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >