我需要编写一个执行以下操作的桌面应用程序。我正在考虑使用Python作为编程语言,但是如果有其他语言的合适方法或库,我将非常乐意切换。在
我希望捕获的文件是一个HWP文件,只有某些字处理程序才能运行。在
在图像中捕获整个HWP文档,可能跨越多个页面(>10和<;15)
HWP文件包含MCQ格式的测验
解析图像中的数据,将问题和答案分开,并将它们保存为单独的图像文件。
我已经研究了下面的python库,但是仍然不能理解如何同时执行1和3。在
https://pypi.python.org/pypi/pyscreenshot
任何帮助都将不胜感激。在
Tags:
如果我没弄错,你需要从图像中提取文本。 对于这个,您应该使用像tesseract这样的OCR。 在使用OCR之前,请尝试清除图像中的噪音。 要分割图像,请尝试添加一些独特的字符串,以区分测验问答
相关问题 更多 >
编程相关推荐