Python中文
首页
教程
问答
标签
搜索
登录
注册
我想自动化手动将数据从PDF提取到excel的过程
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有数百个PDF文件,它们都有完全相同的格式(大部分是表格格式)。我有一个excel工作表,我从表格(PDF)中选择值,并将它们粘贴到excel中的特定位置(也在表格中),以分析数据。我经历过地狱:powershell、itextsharp、acrobat表单、导出数据等,但到目前为止我一直很不走运。不管怎样,我都可以自动完成从PDF中提取数据并将其放入excel的手动过程。同样,所有PDF格式完全相同(只有值不同)</p> <p>编辑:要添加更多详细信息,这些PDF是纳税申报单。我必须合并每月提交的纳税申报表。因此,表格标题在excel中保持不变,只是每个月的值会发生变化,因为不同月份的回报不同。现在我正在打开单个PDF,复制值并将其粘贴到excel工作表中。我想自动化这个过程</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>可以使用tabla和pandas从pdf导出多个表</p> <p>示例代码</p> <p>作为pd进口熊猫 进口表格</p> <p>df=tabla.read\u pdf('path to file',pages='all')</p> <p>对于范围内的i(len(df)): df[i].to_excel('file_'+str(i)+'.xlsx')</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在python中从数据帧列中删除分类值?
1 回答
如何在python中从数据帧列表中删除引号
1 回答
如何在python中从数据帧创建列表
8 回答
如何在Python中从数据帧创建嵌套的JSON
1 回答
如何在Python中从数据帧显示wordcloud
6 回答
如何在Python中从数据帧的时间戳中删除字符
10 回答
如何在Python中从数据帧绘制简单绘图?
4 回答
如何在python中从数据帧行提取具有特定长度的范围?
8 回答
如何在python中从数据帧设置dict中的值
3 回答
如何在Python中从数据库中获得一个结果
1 回答
如何在python中从数据框中绘制分类条形图
1 回答
如何在Python中从数据框中选择特定细节?
6 回答
如何在python中从数据集中删除unicode
1 回答
如何在python中从数据集中删除某些数值?
10 回答
如何在python中从数据集中选择行
6 回答
如何在Python中从数组中删除元素
10 回答
如何在python中从数组中删除单个倒逗号?
1 回答
如何在python中从数组中删除对象?
6 回答
如何在python中从数组中删除引号
5 回答
如何在python中从数组中删除所有最小值
6 回答