修剪扫描中的垃圾或检测图像中文本块的尺寸?

2024-09-28 16:21:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个图像要处理:一个书页的扫描。 我想保留有用的信息,包括角落里的页码,但要裁剪垃圾并扫描图像边缘的人工制品。实现这一点的最佳解决方案是什么(最好是Python)

我需要一个完整的解决方案来清除垃圾,或者至少需要一种方法来检测文本块边缘的起始位置——某种OCR库来检测页面扫描中有用信息区域的尺寸

谢谢

UPD: 样本: https://i.imgur.com/SH8Vqey.png 我希望能够裁剪出扫描的好部分,这样就不会有另一页的一部分通过绑定,页面外部没有黑色,边缘没有扭曲


Tags: 方法图像文本信息区域尺寸页面解决方案