用于OCR清理的正则表达式我一直在把一些书数字化,希望能整理一下目录。我的输出如下所示: Lorem ipsum dolor sit amet, consectetur adipiscing elit. (January 1 ...2024-06-18 已阅读: n次