这是在安装了tabla的Pycharm中运行的代码
进口表格
表格。将_转换为(“https://www.northonline.com.au/content/dam/product/north/summit_investment_options.pdf”,“output.csv”,output_format='csv',pages='3')
我收到这个错误,一些数据产生了,但不是全部。它漏掉了桌子
Got stderr:2020年5月14日下午3:49:39 org.apache.pdfbox.pdmodel.font.pdcifdonttype2 信息:字体GFEDCB+Archer MediumLining中使用的OpenType布局表未在PDFBox中实现,将被忽略
在页面设置为“all”的情况下运行相同的代码只会产生额外的错误
有没有办法添加字体或提取丢失的数据
“信息”并不是一个错误,“部分数据生成,但不是全部”的原因基本上是因为PDF嵌入结构
但是,如果您确实想要获取那些丢失的数据,那么您可以尝试使用另一种方法,即使用CAMELOT库。这将为您提供丢失的数据
相关问题 更多 >
编程相关推荐