如何使用python从对象流中提取pdf?

2024-09-30 16:37:59 发布

您现在位置:Python中文网/ 问答频道 /正文

%PDF-1.4 %Çåôåð 3 0 obj
<<
/Filter /FlateDecode /Length 2305
>>
stream
’›x<Lƒ&Ó o›éäü51⁄4¶†wiËÊþHã›3⁄4é{øöKœ¦ñuÖ„—W1⁄4å? 
üÖé„£1ŽøÃ$·LÂÿKê„×A”áýã.<O ̄Þƒ1⁄41⁄2PT@?‰ùTMß:í ̈¥μàŸ*á펷hî†Ñôo  ́ . 
lÁ&Aj+k- ¿uú'Uù•Gá8A4ŠÏÃèòü£¦Î›Ã(
*°ei”,1ÇO\\®é)91⁄2FAÄ ̄ ̧æc ̧ø§í÷°E(å—@þ¿1ø AF×Ù•Ã0“4 †×
×ì!Ìß“ qÑ@ÙÇÙ‹?où#¿¶T0{a...`CÅE§÷Zùμ_{ ̈ (ûƒ 
endstream
endobj

我想从这个流中提取有意义的pdf,它是用FlateDecode编码的。 我尝试过使用zlib库,但仍然没有得到所需的输出。此外,还有外部参照表和图像子类型,它们也被编码。如果有人知道如何使用python将这些pdf对象转换成pdf,那么请提供帮助


Tags: obj编码streampdffilterlengthlaw1