AmazonWeb服务如何在java中使用AWS Textract检索pdf中存在的表
我发现下面的文章是用python编写的
https://docs.aws.amazon.com/textract/latest/dg/examples-export-table-csv.html
我还使用下面的文章来提取文本
https://docs.aws.amazon.com/textract/latest/dg/detecting-document-text.html
但上面的文章只帮助获取文本,我还使用了函数“block.getBlockType() 块的,但没有一个块返回其类型为“CELL”,即使image/pdf中有表
帮助我找到类似于“boto3”的java库来提取所有表
# 1 楼答案
我在json响应中创建了每个数据集的模型,并可以使用这些模型在jsf中构建一个表视图
要从中创建视图的TableModel:
# 2 楼答案
我也有类似的想法:
这是util文件: