使用pdfminer解析pdf无法获取文本，而是获取cid - 问答 - Python中文网

使用pdfminer解析pdf无法获取文本，而是获取cid

2024-06-26 14:48:24 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我想用pdfminer解析pdf文件，大多数pdf文件我都能成功地得到文本，但是对于其他的，我只得到cids而不是真正的文本。输出如下：

2016 (cid:411) 1 (cid:579) 1 (cid:556)(cid:851) 2016 (cid:411) 12 (cid:579) 31 (cid:556) (cid:512)(cid:1) (cid:226)(cid:99)(cid:1054)(cid:971)(cid:174)(cid:834)(cid:97)(cid:62)(cid:844)(cid:114)(cid:580)(cid:1044)(cid:166)(cid:261)(cid:166)(cid:261)(cid:779)(cid:770)(cid:1)...

我也试过命令：

^{pr2}$

不起作用。在

失败的pdf文件链接： http://www.neeq.com.cn/disclosure/2017/2017-01-16/1484566464_337129.pdf

提前谢谢你。在

Tags：文件文本命令 com http pdf 链接 www

0条回答

目前没有回答

相关问题更多 >

编程相关推荐

热门问题

热门文章