如何使用python中的tika解析器提取每页超过2000个字符的pdf页面?我想使用python中的tika解析器提取每页超过2000个字符的pdf页面。从下面的代码中,我提取了[metadata],并从中使用pdf:charsPerPage获得每页的最小字符数限制(如200 ...2024-10-03 已阅读: n次