在某些PDF中搜索并替换

2024-10-05 20:06:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我有个大问题。我有一些pdf文件,其中我有一些文字,我想改变(不需要OCR)。你知道吗

我尝试了一些解决方案changepagestring工作,但不是所有的发生有时它不匹配,但发生存在…(例如,它找到S,但我找不到SF和acrobat或其他解决方案找到SF)

我尝试了pdftotext/pdfgrep,似乎找到了所有出现的内容,但无法重新生成pdf。你知道吗

事实上,我有大约500个事件和200个PDF我负担不起这样做一个接一个。你知道吗

如果你有什么线索的话,那真的很有帮助。你知道吗

编辑1: 他们是一些改进,我解压缩了一个文件和applie cmd字符串 结果是:

[(feu)6.9( HDU)-5.3(130)-5.8(RRFI )]TJ
[(feu)6.8( HD)7.3(U)-5.4(10)-5.9(1H)-9.7(RRFI )]TJ
[(feu)6.8( HD)7.3(U)-5.4(80)-5.9(1H)-9.7(RRFI )]TJ
[(feu)6.8( HD)7.3(U)-5.4(3055)-5.9(1H)-9.7(RRFI )]TJ

在这里我们可以看到我想找到的单词:
第一条直线:(HD)。(U)。(130)。(RRFI)=HDU130RRFI


Tags: 文件内容pdfsf解决方案ocr文字hd