我试着读一个多页的PDF文件,它在每一页的相同区域中都包含一个表。 页数可以根据正在读取的文件而改变。在
我正在尝试下面的代码,但它不起作用:
import tabula
df = tabula.read_pdf("dados/nota.pdf", guess=False, stream=True, pages='all', encoding="utf-8", area=(238.00, 32.00, 400.00, 563.00))
返回错误:
^{pr2}$在read_pdf中,如果我将pages='all'更改为pages=1、pages=2等,则可以正常工作,但我需要指定必须读取所有页面,并且此数字可以根据文件更改。在
有人知道这件事吗?在
编辑:我通过插入多个“tables=True”参数来读取表。现在的代码是:
^{3}$我得到的结果是:
[ 0 1 2 3 4 5 \
0 Q Negociação C/V Tipo mercado Prazo Especificação do título
1 NaN 1-BOVESPA C VISTA NaN ITAUSAPN N1
2 NaN 1-BOVESPA C VISTA NaN LOCAMERICAON EB NM
3 NaN 1-BOVESPA C VISTA NaN LOCAMERICAON EB NM
4 NaN 1-BOVESPA C VISTA NaN PETRORIOON NM
5 NaN 1-BOVESPA C VISTA NaN PETRORIOON NM
6 NaN 1-BOVESPA C VISTA NaN SCHULZPN
7 NaN 1-BOVESPA C VISTA NaN SCHULZPN
8 NaN 1-BOVESPA C VISTA NaN VULCABRASON NM
9 NaN 1-BOVESPA C VISTA NaN VULCABRASON NM
10 NaN 1-BOVESPA C VISTA NaN VULCABRASON NM
11 NaN 1-BOVESPA C VISTA NaN VULCABRASON NM
6 7 8 9 10 11
0 Obs. (*) Quantidade NaN Preço / Ajuste Valor Operação / Ajuste D/C
1 NaN NaN 800 13,84 11.072,00 D
2 NaN NaN 300 17,01 5.103,00 D
3 NaN NaN 200 17,01 3.402,00 D
4 NaN NaN 500 18,01 9.005,00 D
5 NaN NaN 100 18,01 1.801,00 D
6 NaN NaN 500 8,79 4.395,00 D
7 NaN NaN 700 8,78 6.146,00 D
8 NaN NaN 300 7,87 2.361,00 D
9 NaN NaN 300 7,87 2.361,00 D
10 NaN NaN 300 7,87 2.361,00 D
11 NaN NaN 200 7,87 1.574,00 D ,
0 1 2 3 4 5 \
0 Q Negociação C/V Tipo mercado Prazo Especificação do título
1 NaN 1-BOVESPA V VISTA NaN LOCAMERICAON NM
2 NaN 1-BOVESPA V VISTA NaN LOCAMERICAON NM
3 NaN 1-BOVESPA V VISTA NaN LOCAMERICAON NM
4 NaN 1-BOVESPA V VISTA NaN LOCAMERICAON NM
5 NaN 1-BOVESPA V VISTA NaN LOCAMERICAON NM
6 NaN 1-BOVESPA V VISTA NaN PETRORIOON NM
7 NaN 1-BOVESPA C VISTA NaN VULCABRASON NM
8 NaN 1-BOVESPA V VISTA NaN VULCABRASON NM
9 NaN 1-BOVESPA V VISTA NaN VULCABRASON NM
10 NaN 1-BOVESPA V VISTA NaN VULCABRASON NM
6 7 8 9 10 11 12
0 Obs. (*) Quantidade NaN Preço / Ajuste Valor Operação / Ajuste NaN D/C
1 NaN 100 NaN 17,20 1.720,00 NaN C
2 NaN 100 NaN 17,20 1.720,00 NaN C
3 NaN 100 NaN 17,20 1.720,00 NaN C
4 NaN 100 NaN 17,20 1.720,00 NaN C
5 NaN 100 NaN 17,20 1.720,00 NaN C
6 NaN 600 NaN 18,60 11.160,00 NaN C
7 D 1.100 NaN 7,75 8.525,00 NaN D
8 D 100 NaN 7,86 786,00 NaN C
9 D 100 NaN 7,86 786,00 NaN C
10 D 900 NaN 7,86 7.074,00 NaN C ]
我怎么把它变成日期框?在
由于历史原因,result with multiple tables选项返回DataFrame列表。在
可以通过以下方式转换为数据帧:
相关问题 更多 >
编程相关推荐