字体中使用的Python Table OpenType布局表未在PDFBox中实现,将被忽略

2024-06-25 23:11:59 发布

您现在位置:Python中文网/ 问答频道 /正文

这是在安装了tabla的Pycharm中运行的代码

进口表格

表格。将_转换为(“https://www.northonline.com.au/content/dam/product/north/summit_investment_options.pdf”,“output.csv”,output_format='csv',pages='3')

我收到这个错误,一些数据产生了,但不是全部。它漏掉了桌子

Got stderr:2020年5月14日下午3:49:39 org.apache.pdfbox.pdmodel.font.pdcifdonttype2 信息:字体GFEDCB+Archer MediumLining中使用的OpenType布局表未在PDFBox中实现,将被忽略

在页面设置为“all”的情况下运行相同的代码只会产生额外的错误

有没有办法添加字体或提取丢失的数据


Tags: csv数据代码httpscomoutputwww错误
0条回答
网友
1楼 · 发布于 2024-06-25 23:11:59

“信息”并不是一个错误,“部分数据生成,但不是全部”的原因基本上是因为PDF嵌入结构

但是,如果您确实想要获取那些丢失的数据,那么您可以尝试使用另一种方法,即使用CAMELOT库。这将为您提供丢失的数据

相关问题 更多 >